* 日本語構文・格解析システム KNP [#s5f25810]

KNPは日本語文の構文・格・照応解析を行うシステムです.形態素解析システムJUMANの解析結果(形態素列)を入力とし, 文節および基本句間の係り受け関係,格関係,照応関係を出力します.
係り受け関係,格関係および照応関係は,Webから自動構築した大規模格フレームに基づく確率的モデルにより決定します.

- [[KNPを試してみる:http://reed.kuee.kyoto-u.ac.jp/nl-resource/cgi-bin/knp.cgi]]

&br;

*** バージョン4.1の拡張点 (2013/12/20) &color(red){[New!]}; [#m178cbe7]

- 照応解析機能の追加
- 固有表現解析の精度向上
- 名詞格フレーム辞書の大規模化 (70億文Webテキストから構築)


*** バージョン4.0の拡張点 (2012/01/12) [#e87f7129]

- 格フレーム辞書の大規模化 (70億文Webテキストから構築)
- CRFに基づく固有表現解析機能の追加
- 類似度計算における分布類似度の利用
- UTF-8化

たとえば,次のようなテキストを入力すると,

 % cat test.txt
 クロールで泳いでいる少女を見た
 望遠鏡で泳いでいる少女を見た
 機内の楽しみって「おやつ」と「機内食」しかなく〜今まで満足したことなかったけど、フィリピンエアライン〜良かったよ!

以下の解析結果が得られます.

 % juman < test.txt | knp
 クロールで──┐         
         泳いでいる──┐     
                     少女を──┐ 
                               見た
 EOS
       望遠──┐     
               鏡で──┐ 
 泳いでいる──┐   │ 
             少女を──┤ 
                       見た
 EOS
 
          機内の──┐             
              楽しみって──┐         
   「おやつ」と<P>─┐   │         
 「機内食」しか<P>─PARA──┤         
                          なく〜──┐     
                          今まで──┤     
              満足したことなかったけど、──┐ 
                      フィリピン──┐   │ 
                            エアライン〜──┤ 
                                    良かったよ!
 EOS

&br;


** 動作環境 [#t6a63e5c]

- OS: Unix系システム もしくは Microsoft Windows(XP以降)
- メモリ: 1GB以上 (2GB以上を推奨)
- ディスク: 10GB以上の空き容量

&br;

** ダウンロード [#tae6acce]
- [[KNP Ver.4.11:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.11.tar.bz2&name=knp-4.11.tar.bz2]] (bzip2圧縮; 799,663,152 bytes)
- [[KNP Ver.4.11 (Windows 32bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.11-x86-installer.exe&name=knp-4.11-x86-installer.exe]] (インストーラ付; 979,268,626 bytes) &color(red){[New!]};
- [[KNP Ver.4.11 (Windows 64bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.11-x64-installer.exe&name=knp-4.11-x64-installer.exe]] (インストーラ付; 979,363,446 bytes) &color(red){[New!]};

- 旧バージョン
-- [[KNP Ver.4.01:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.01.tar.bz2&name=knp-4.01.tar.bz2]] (bzip2圧縮; 700,204,171 bytes)
-- [[KNP Ver.4.01 (Windows 32bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.01-x86-installer.exe&name=knp-4.01-x86-installer.exe]] (インストーラ付; 785,583,395 bytes)
-- [[KNP Ver.4.01 (Windows 64bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.01-x64-installer.exe&name=knp-4.01-x64-installer.exe]] (インストーラ付; 785,658,924 bytes)

-- [[KNP Ver.3.01:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-3.01.tar.gz&name=knp-3.01.tar.gz]] (gzip圧縮; 194,843,064 bytes)
-- [[KNP Ver.3.01 (Windows版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-3.01.exe&name=knp-3.01.exe]] (190,306,004 bytes)


&br;


** ドキュメント [#we1c7f7e]
- JUMAN/KNPのチュートリアル~
(京都大学学術情報メディアセンター, メディア情報処理専修コース「自然言語処理技術」, 2009/09/30)
-- [[スライド:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/20090930-juman-knp.ppt&name=20090930-juman-knp.ppt]]
-- [[Perlサンプルスクリプト:http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/juman-knp-20090930/perl-src.zip]]
-- [[Perlモジュールインストーラ:http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/juman-knp-20090930/perl-install.zip]] (for Active Perl 5.8.8)

- [[FAQ>KNP/FAQ]]
- [[格解析結果の書式>KNP/格解析結果書式]]

&br;


** 更新履歴 [#b40d215f]

- 4.11 - 2014/01/20公開~
共参照解析用の同義語辞書を追加
- 4.1 - 2013/12/20公開
- 4.1 beta - 2013/03/13公開
- 4.01 - 2012/04/26公開~
buffer overrunなどのバグをフィックス
- 4.0  - 2012/01/12公開

&br;


** デモ [#ye70b280]
- [[KNPを試してみる:http://reed.kuee.kyoto-u.ac.jp/nl-resource/cgi-bin/knp.cgi]]

&br;

** 参考文献 [#yf2965c6]

- Daisuke Kawahara and Sadao Kurohashi.~
A Fully-Lexicalized Probabilistic Model for Japanese Syntactic and Case Structure Analysis, 
In Proceedings of the Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics (HLT-NAACL2006), pp.176-183, 2006.

- 河原大輔, 黒橋禎夫.~
自動構築した大規模格フレームに基づく構文・格解析の統合的確率モデル, 
自然言語処理, Vol.14, No.4, pp.67-81, 2007.

- Ryohei Sasano and Sadao Kurohashi.~
A Discriminative Approach to Japanese Zero Anaphora Resolution with Large-scale Lexicalized Case Frames, 
In Proceedings of the 5th International Joint Conference on Natural Language Processing (IJCNLP2011), 
pp.758-766, 2011.

- 笹野遼平, 黒橋禎夫.~
大規模格フレームを用いた識別モデルに基づく日本語ゼロ照応解析, 
情報処理学会論文誌, Vol.52, No.12, pp.3328-3337, 2011.

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS