- 追加された行はこの色です。
- 削除された行はこの色です。
* 日本語構文・格・照応解析システム KNP [#s5f25810]
KNPは日本語文の構文・格・照応解析を行うシステムです.形態素解析システムJUMANの解析結果(形態素列)を入力とし, 文節および基本句間の係り受け関係,格関係,照応関係を出力します.
係り受け関係,格関係および照応関係は,Webから自動構築した大規模格フレームに基づく確率的モデルにより決定します.
- [[KNPを試してみる:http://reed.kuee.kyoto-u.ac.jp/nl-resource/cgi-bin/knp.cgi]]
&br;
*** バージョン4.1の拡張点 (2013/12/20) &color(red){[New!]}; [#m178cbe7]
- 照応解析機能の追加
- 固有表現解析の精度向上
- 名詞格フレーム辞書の大規模化 (70億文Webテキストから構築)
*** バージョン4.0の拡張点 (2012/01/12) [#e87f7129]
- 格フレーム辞書の大規模化 (70億文Webテキストから構築)
- CRFに基づく固有表現解析機能の追加
- 類似度計算における分布類似度の利用
- UTF-8化
たとえば,次のようなテキストを入力すると,
% cat test.txt
クロールで泳いでいる少女を見た
望遠鏡で泳いでいる少女を見た
機内の楽しみって「おやつ」と「機内食」しかなく〜今まで満足したことなかったけど、フィリピンエアライン〜良かったよ!
以下の解析結果が得られます.
% juman < test.txt | knp
クロールで──┐
泳いでいる──┐
少女を──┐
見た
EOS
望遠──┐
鏡で──┐
泳いでいる──┐ │
少女を──┤
見た
EOS
機内の──┐
楽しみって──┐
「おやつ」と<P>─┐ │
「機内食」しか<P>─PARA──┤
なく〜──┐
今まで──┤
満足したことなかったけど、──┐
フィリピン──┐ │
エアライン〜──┤
良かったよ!
EOS
&br;
** 動作環境 [#t6a63e5c]
- OS: Unix系システム もしくは Microsoft Windows(XP以降)
- メモリ: 1GB以上 (2GB以上を推奨)
- ディスク: 10GB以上の空き容量
&br;
** ダウンロード [#tae6acce]
- [[KNP Ver.4.14:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.14.tar.bz2&name=knp-4.14.tar.bz2]] (bzip2圧縮; 800,399,224 bytes) &color(red){[New!]};
- [[KNP Ver.4.15:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.15.tar.bz2&name=knp-4.15.tar.bz2]] (bzip2圧縮; 800,407,521 bytes) &color(red){[New!]};
- [[KNP Ver.4.11 (Windows 32bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.11-x86-installer.exe&name=knp-4.11-x86-installer.exe]] (インストーラ付; 979,268,626 bytes)
- [[KNP Ver.4.11 (Windows 64bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.11-x64-installer.exe&name=knp-4.11-x64-installer.exe]] (インストーラ付; 979,363,446 bytes)
- 旧バージョン
-- [[KNP Ver.4.12:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.12.tar.bz2&name=knp-4.12.tar.bz2]] (bzip2圧縮; 800,422,131 bytes)
-- [[KNP Ver.4.14:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.14.tar.bz2&name=knp-4.14.tar.bz2]] (bzip2圧縮; 800,399,224 bytes)
-- [[KNP Ver.4.01:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.01.tar.bz2&name=knp-4.01.tar.bz2]] (bzip2圧縮; 700,204,171 bytes)
-- [[KNP Ver.4.01 (Windows 32bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.01-x86-installer.exe&name=knp-4.01-x86-installer.exe]] (インストーラ付; 785,583,395 bytes)
-- [[KNP Ver.4.01 (Windows 64bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.01-x64-installer.exe&name=knp-4.01-x64-installer.exe]] (インストーラ付; 785,658,924 bytes)
-- [[KNP Ver.3.01:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-3.01.tar.gz&name=knp-3.01.tar.gz]] (gzip圧縮; 194,843,064 bytes)
-- [[KNP Ver.3.01 (Windows版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-3.01.exe&name=knp-3.01.exe]] (190,306,004 bytes)
- バインディング
-- perl: 上記パッケージ同梱の knp-X.XX/perl 以下のものをお使い下さい
--- Windows版は次からダウンロードして下さい: [[Perlモジュールインストーラ:http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/juman-knp-20090930/perl-install.zip]] (for Active Perl 5.8.8), [[Perlサンプルスクリプト:http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/juman-knp-20090930/perl-src.zip]]
-- python: [[pyknp-0.1.zip:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/pyknp-0.1.zip&name=pyknp-0.1.zip]]
&br;
** ドキュメント [#we1c7f7e]
- JUMAN/KNPのチュートリアル~
(京都大学学術情報メディアセンター, メディア情報処理専修コース「自然言語処理技術」, 2009/09/30)
-- [[スライド:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/20090930-juman-knp.ppt&name=20090930-juman-knp.ppt]]
- [[FAQ>KNP/FAQ]]
- [[インストール方法>KNP/インストール方法]]
- [[格解析結果の書式>KNP/格解析結果書式]]
- [[照応解析結果の書式>KNP/照応解析結果書式]]
&br;
** 更新履歴 [#b40d215f]
- 4.15 - 2015/11/16公開~
-- 「する」の格フレーム数を制限することによって、80%程度の高速化
- 4.14 - 2015/07/13公開~
-- 共参照解析、固有表現解析のバグフィックス
-- 照応解析オプション指定時に係り受けが変化する場合があったのを修正
- 4.13 - 2015/04/28公開~
-- 固有表現解析の学習オプション(-ne-train)の追加
- 4.12 - 2014/12/22公開~
-- 共参照解析のバグフィックス
-- 固有表現解析のデフォルト化
-- CRF++の同梱
-- コンパイルエラーに対処
- 4.11 - 2014/01/20公開~
-- 共参照解析用の同義語辞書を追加
- 4.1 - 2013/12/20公開
- 4.1 beta - 2013/03/13公開
- 4.01 - 2012/04/26公開~
-- buffer overrunなどのバグをフィックス
- 4.0 - 2012/01/12公開
&br;
** デモ [#ye70b280]
- [[KNPを試してみる:http://lotus.kuee.kyoto-u.ac.jp/nl-resource/cgi-bin/knp.cgi]]
&br;
** 参考文献 [#yf2965c6]
- Daisuke Kawahara and Sadao Kurohashi.~
A Fully-Lexicalized Probabilistic Model for Japanese Syntactic and Case Structure Analysis,
In Proceedings of the Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics (HLT-NAACL2006), pp.176-183, 2006.
- 河原大輔, 黒橋禎夫.~
自動構築した大規模格フレームに基づく構文・格解析の統合的確率モデル,
自然言語処理, Vol.14, No.4, pp.67-81, 2007.
- Ryohei Sasano and Sadao Kurohashi.~
A Discriminative Approach to Japanese Zero Anaphora Resolution with Large-scale Lexicalized Case Frames,
In Proceedings of the 5th International Joint Conference on Natural Language Processing (IJCNLP2011),
pp.758-766, 2011.
- 笹野遼平, 黒橋禎夫.~
大規模格フレームを用いた識別モデルに基づく日本語ゼロ照応解析,
情報処理学会論文誌, Vol.52, No.12, pp.3328-3337, 2011.