* 日本語形態素解析システム JUMAN [#l02f19c6] 本システムは,計算機による日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツールを提供するために開発されました.その際, 学校文法が計算機向きではないという問題を考慮し,使用者によって文法の定義,単語間の接続関係の定義などを容易に変更できるように配慮しました. 新バージョン7.0の拡張点は以下の通りです. - 非反復形オノマトペ,長音記号による非標準表記,長音記号・小書き文字を用いた長音化の自動認識 - Wikipediaから抽出した辞書の追加 - 自動辞書(Webテキストから自動獲得した辞書)の改良 - UTF-8化 たとえば,次のようなテキストを入力すると, % cat sample.txt カサつく ビミョーだ がんがる アジャイルだ 爽健美茶 ThinkPad 上海ガニ ぺっちゃりしてる ありがとー 行きたぁぁぁい 以下の解析結果が得られます. % juman < sample.txt カサつく カサつく カサつく 動詞 2 * 0 子音動詞カ行 2 基本形 2 "代表表記:かさつく/かさつく 自動獲得:テキスト 既知語帰着:表記・出現類似 ドメイン:健康・医学" EOS ビミョーだ ビミョーだ ビミョーだ 形容詞 3 * 0 ナ形容詞 21 基本形 2 "代表表記:微妙だ/びみょうだ 自動獲得:テキスト 既知語帰着:表記・出現類似" EOS がんがる がんがる がんがる 動詞 2 * 0 子音動詞ラ行 10 基本形 2 "自動獲得:テキスト" EOS アジャイルだ アジャイルだ アジャイルだ 形容詞 3 * 0 ナ形容詞 21 基本形 2 "自動獲得:テキスト" EOS 爽健美茶 そうけんびちゃ 爽健美茶 名詞 6 普通名詞 1 * 0 * 0 "自動獲得:Wikipedia Wikipedia上位語:清涼飲料水" EOS ThinkPad シンクパッド ThinkPad 名詞 6 普通名詞 1 * 0 * 0 "自動獲得:Wikipedia Wikipedia上位語:ノートパソコン" @ ThinkPad ThinkPad ThinkPad 未定義語 15 アルファベット 3 * 0 * 0 NIL EOS 上海 しゃんはい 上海 名詞 6 地名 4 * 0 * 0 "代表表記:上海/しゃんはい 地名:国:中国:市" ガニ がに カニ 名詞 6 普通名詞 1 * 0 * 0 "代表表記:蟹/かに カテゴリ:動物;人工物-食べ物 ドメイン:料理・食事 濁音化" EOS ぺっちゃり ぺっちゃり ぺっちゃり 副詞 8 * 0 * 0 * 0 "自動認識" して して する 動詞 2 * 0 サ変動詞 16 タ系連用テ形 14 "代表表記:する/する 付属動詞候補(基本) 自他動詞:自:成る/なる" る る る 接尾辞 14 動詞性接尾辞 7 母音動詞 1 基本形 2 "代表表記:る/る" EOS ありがとー ありがとう ありがとう 感動詞 12 * 0 * 0 * 0 "代表表記:ありがとう/ありがとう 非標準表記" EOS 行き いき 行く 動詞 2 * 0 子音動詞カ行促音便形 3 基本連用形 8 "代表表記:行く/いく 付属動詞候補(タ系) ドメイン:交通 反義:動詞:帰る/かえる" たぁぁぁい たい たい 接尾辞 14 形容詞性述語接尾辞 5 イ形容詞アウオ段 18 基本形 2 "代表表記:たい/たい 長音挿入" EOS なお,自動辞書とWikipedia辞書は定期的に更新し,本ページにて最新版を公開する予定です. &br; ** ダウンロード [#t6ce0811] - [[JUMAN Ver.7.0:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-7.0.tar.bz2&name=juman-7.0.tar.bz2]]をダウンロード (bzip2圧縮; 4,251,424 bytes) - [[JUMAN Ver.7.0 (Windows 32bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-7.0-x86-installer.exe&name=juman-7.0-x86-installer.exe]]をダウンロード (インストーラ付; 8,276,060 bytes) - [[JUMAN Ver.7.0 (Windows 64bit版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-7.0-x64-installer.exe&name=juman-7.0-x64-installer.exe]]をダウンロード (インストーラ付; 8,330,604 bytes) - [[JUMAN/KNPのチュートリアルのスライド:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/20090930-juman-knp.ppt&name=20090930-juman-knp.ppt]]~ // - [[JUMAN/KNPのチュートリアルのスライド:http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/20090930-juman-knp.ppt]]~ (京都大学学術情報メディアセンター, メディア情報処理専修コース「自然言語処理技術」, 2009/09/30) - 旧バージョン -- [[JUMAN Ver.6.0:http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-6.01.tar.gz&name=juman-6.0.tar.gz]]をダウンロード (gzip圧縮; 1,617,065 bytes) -- [[JUMAN Ver.6.0 (Windows版):http://nlp.ist.i.kyoto-u.ac.jp/DLcounter/lime.cgi?down=http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-6.0.exe&name=juman-6.0.exe]]をダウンロード (3,271,723 bytes) &br; ** デモ [#m12793de] - [[JUMANを試してみる:http://reed.kuee.kyoto-u.ac.jp/nl-resource/juman-form.html]]