日本語形態素解析システム JUMAN

本システムは,計算機による日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツールを提供するために開発されました.その際, 学校文法が計算機向きではないという問題を考慮し,使用者によって文法の定義,単語間の接続関係の定義などを容易に変更できるように配慮しました.

新バージョン7.0の拡張点は以下の通りです.

たとえば,次のようなテキストを入力すると,

% cat sample.txt
カサつく
ビミョーだ
がんがる
アジャイルだ
爽健美茶
ThinkPad
上海ガニ
ぺっちゃりしてる
ありがとー
行きたぁぁぁい

以下の解析結果が得られます.

% juman < sample.txt
カサつく カサつく カサつく 動詞 2 * 0 子音動詞カ行 2 基本形 2 "代表表記:かさつく/かさつく 自動獲得:テキスト 既知語帰着:表記・出現類似 ドメイン:健康・医学"
EOS
ビミョーだ ビミョーだ ビミョーだ 形容詞 3 * 0 ナ形容詞 21 基本形 2 "代表表記:微妙だ/びみょうだ 自動獲得:テキスト 既知語帰着:表記・出現類似"
EOS
がんがる がんがる がんがる 動詞 2 * 0 子音動詞ラ行 10 基本形 2 "自動獲得:テキスト"
EOS
アジャイルだ アジャイルだ アジャイルだ 形容詞 3 * 0 ナ形容詞 21 基本形 2 "自動獲得:テキスト"
EOS
爽健美茶 そうけんびちゃ 爽健美茶 名詞 6 普通名詞 1 * 0 * 0 "自動獲得:Wikipedia Wikipedia上位語:清涼飲料水"
EOS
ThinkPad シンクパッド ThinkPad 名詞 6 普通名詞 1 * 0 * 0 "自動獲得:Wikipedia Wikipedia上位語:ノートパソコン"
@ ThinkPad ThinkPad ThinkPad 未定義語 15 アルファベット 3 * 0 * 0 NIL
EOS
上海 しゃんはい 上海 名詞 6 地名 4 * 0 * 0 "代表表記:上海/しゃんはい 地名:国:中国:市"
ガニ がに カニ 名詞 6 普通名詞 1 * 0 * 0 "代表表記:蟹/かに カテゴリ:動物;人工物-食べ物 ドメイン:料理・食事 濁音化"
EOS
ぺっちゃり ぺっちゃり ぺっちゃり 副詞 8 * 0 * 0 * 0 "自動認識"
して して する 動詞 2 * 0 サ変動詞 16 タ系連用テ形 14 "代表表記:する/する 付属動詞候補(基本) 自他動詞:自:成る/なる"
る る る 接尾辞 14 動詞性接尾辞 7 母音動詞 1 基本形 2 "代表表記:る/る"
EOS
ありがとー ありがとう ありがとう 感動詞 12 * 0 * 0 * 0 "代表表記:ありがとう/ありがとう 非標準表記"
EOS
行き いき 行く 動詞 2 * 0 子音動詞カ行促音便形 3 基本連用形 8 "代表表記:行く/いく 付属動詞候補(タ系) ドメイン:交通 反義:動詞:帰る/かえる"
たぁぁぁい たい たい 接尾辞 14 形容詞性述語接尾辞 5 イ形容詞アウオ段 18 基本形 2 "代表表記:たい/たい 長音挿入"
EOS

なお,自動辞書とWikipedia辞書は定期的に更新し,本ページにて最新版を公開する予定です.


動作環境


ダウンロード


デモ