- 追加された行はこの色です。
- 削除された行はこの色です。
* 日本語形態素解析システム JUMAN++ [#l6dc5533]
本システムは,計算機による日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツールを提供するために開発されました.その際, 学校文法が計算機向きではないという問題を考慮し,使用者によって文法の定義,単語間の接続関係の定義などを容易に変更できるように配慮しました.★
たとえば,次のようなテキストを入力すると,
% cat sample.txt
外国人参政権
私もあさって日曜最終日
以下の解析結果が得られます.
% cat sample.txt | jumanpp
外国 がいこく 外国 名詞 6 普通名詞 1 * 0 * 0 "代表表記:外国/がいこく カテゴリ:場所-その他 ドメイン:政治"
人 じん 人 名詞 6 普通名詞 1 * 0 * 0 "代表表記:人/じん 漢字読み:音 カテゴリ:人"
@ 人 ひと 人 名詞 6 普通名詞 1 * 0 * 0 "代表表記:人/ひと 漢字読み:訓 カテゴリ:人"
参政 さんせい 参政 名詞 6 サ変名詞 2 * 0 * 0 "代表表記:参政/さんせい カテゴリ:抽象物 ドメイン:政治"
権 けん 権 名詞 6 普通名詞 1 * 0 * 0 "代表表記:権/けん 漢字読み:音 カテゴリ:抽象物"
EOS
私 わたし 私 名詞 6 普通名詞 1 * 0 * 0 "代表表記:私/わたし 漢字読み:訓 カテゴリ:人"
も も も 助詞 9 副助詞 2 * 0 * 0 NIL
あさって あさって あさって 名詞 6 時相名詞 10 * 0 * 0 "代表表記:明後日/あさって カテゴリ:時間"
日曜 にちよう 日曜 名詞 6 時相名詞 10 * 0 * 0 "代表表記:日曜/にちよう カテゴリ:時間"
最終 さいしゅう 最終だ 形容詞 3 * 0 ナノ形容詞 22 語幹 1 "代表表記:最終だ/さいしゅうだ 反義:形容詞:最初だ/さいしょだ"
日 ひ 日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:日/ひ 漢字読み:訓 弱時相名詞 カテゴリ:時間"
@ 日 にち 日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:日/にち 漢字読み:音 カテゴリ:時間"
EOS
なお,リソースファイルは定期的に更新し,本ページにて最新版を公開する予定です.
&br;
** 動作環境 [#be3e2f71]
- OS: Unix系システム もしくは Microsoft Windows(XP以降)
- メモリ: 4GB以上
- ディスク: 2GB以上の空き容量
&br;
** ダウンロード [#baf6ff29]
- [[JUMAN++ Ver.1.0:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-7.01.tar.bz2&name=juman-7.01.tar.bz2]] (bzip2圧縮; xxx bytes)
- [[JUMAN++ リソースファイル v1.0-20160831:http://somewhere/]] (bzip2圧縮; xxx bytes)
- [[JUMAN++ マニュアル v1.0]] (pdf)
- [[情報処理学会のスライド:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/20090930-juman-knp.ppt&name=20090930-juman-knp.ppt]] (pdf)~
** 部分アノテーション [#w80dff32]
★ 概要
- [[部分アノテーション共有ページ:http://somewhre/]]
** 更新履歴 [#z9dc3378]
- 1.0 - 2016/8/31 公開予定
&br;
** デモ [#u26250d1]
- [[JUMAN++を試してみる:lotus.kuee.kyoto-u.ac.jp/demo/jumanpp.cgi]]