[日本語] /
[English]
京都大学
大学院情報学研究科
知能情報学コース
言語メディア分野(
工学部電気電子工学科
)
研究室へのアクセス
Top
メンバー
研究紹介
研究内容
研究助成一覧
学位取得者一覧
研究発表一覧
2024年度
2023年度
2022年度
2021年度
2020年度
2019年度
2018年度
2017年度
2016年度
2015年度
2014年度
2013年度
2012年度
2011年度
2010年度
2009年度
2008年度
2007年度
2006年度
NLPリソース
===ツール===
日本語解析器KWJA
形態素解析システムJUMAN
形態素解析システムJuman++
構文解析システムKNP
┗ PyKNP
解析結果汎用表示ツール
機械翻訳システムKyotoEBMT
===データ===
京大テキストコーパス
京大ウェブ文書リードコーパス
京大格フレーム
京大名詞格フレーム
日本語Wikipedia入力誤りデータ
基本料理知識ベース
BERT日本語Pretrainedモデル
RTE評価データ
日英中基本文データ
日本語SNLI(JSNLI)データセット
京都大学常識推論データセット
述部意味関係コーパス
ASPEC
SCTB
CTB5.0 Re-annotation
CTB5 chara POS annotation
TriTechDict
内部ページ
開始行:
* 日本語形態素解析システム Juman++ [#l6dc5533]
Juman++は言語モデルを利用した高性能な形態素解析システムで...
** 使用方法 [#zfb55bba]
たとえば,次のようなテキストを入力すると,
% cat sample.txt
外国人参政権
私もあさって日曜最終日
以下の解析結果が得られます.
% cat sample.txt | jumanpp
外国 がいこく 外国 名詞 6 普通名詞 1 * 0 * 0 "代表表記:...
人 じん 人 名詞 6 普通名詞 1 * 0 * 0 "代表表記:人/じん ...
@ 人 ひと 人 名詞 6 普通名詞 1 * 0 * 0 "代表表記:人/ひと...
参政 さんせい 参政 名詞 6 サ変名詞 2 * 0 * 0 "代表表記:...
権 けん 権 名詞 6 普通名詞 1 * 0 * 0 "代表表記:権/けん ...
EOS
私 わたし 私 名詞 6 普通名詞 1 * 0 * 0 "代表表記:私/わた...
も も も 助詞 9 副助詞 2 * 0 * 0 NIL
あさって あさって あさって 名詞 6 時相名詞 10 * 0 * 0 "...
日曜 にちよう 日曜 名詞 6 時相名詞 10 * 0 * 0 "代表表記:...
最終 さいしゅう 最終だ 形容詞 3 * 0 ナノ形容詞 22 語幹 1...
日 ひ 日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:日/ひ 漢字...
@ 日 にち 日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:日/に...
EOS
詳しい使い方はマニュアルを参照してください.
なお,リソースファイルは定期的に更新し,本ページにて最新...
&br;
** 動作環境 [#be3e2f71]
- OS: Linux( Cent OS 6.7 で動作を確認)
- メモリ: 4GB以上
- ディスク: 2GB以上の空き容量
** 必須ツール・ライブラリ [#cbd0ac7b]
- gcc (4.9 以降)
- Boost C++ Libraries (1.57 以降)
&br;
** ダウンロード [#baf6ff29]
- [[Juman++ V2の開発版>https://github.com/ku-nlp/jumanpp]...
//- [[JUMAN++ Ver.1.00:https://nlp.ist.i.kyoto-u.ac.jp/DL...
//- [[JUMAN++ Ver.1.01:https://nlp.ist.i.kyoto-u.ac.jp/DL...
- [[JUMAN++ Ver.1.02:https://nlp.ist.i.kyoto-u.ac.jp/DLco...
//- [[JUMAN++ マニュアル v1.00:https://nlp.ist.i.kyoto-u....
- [[JUMAN++ マニュアル v1.01:https://nlp.ist.i.kyoto-u.ac...
- [[発表資料:https://nlp.ist.i.kyoto-u.ac.jp/DLcounter/li...
*** 旧バージョン [#t1a2609e]
- [[JUMAN++ Ver.1.01:https://nlp.ist.i.kyoto-u.ac.jp/DLco...
- [[JUMAN++ Ver.1.00:https://nlp.ist.i.kyoto-u.ac.jp/DLco...
** 部分アノテーション [#w80dff32]
本システムでは,明らかな解析の誤りについては専門的な知識...
作成した部分アノテーションは以下のページで共有,公開する...
- [[部分アノテーション共有ページ:https://lotus.kuee.kyoto...
** 更新履歴 [#z9dc3378]
- 1.02 - 2017/1/12 辞書構築時の不具合を修正,Wiktionary ...
- 1.01 - 2016/9/29 不具合を修正
- 1.00 - 2016/9/23 公開
- 1.0p - 2016/9/16 preview版公開
&br;
** ライセンス [#e4a2a08d]
- [[Apache License, Version 2.0:http://www.apache.org/lic...
** 参考文献 [#e31ad48f]
- Hajime Morita, Daisuke Kawahara and Sadao Kurohashi: Mo...
- 森田一, 黒橋 禎夫: RNN 言語モデルを用いた日本語形態素解...
** デモ [#u26250d1]
- [[Juman++を試してみる:http://tulip.kuee.kyoto-u.ac.jp/d...
//- [[JUMAN++を試してみる:https://lotus.kuee.kyoto-u.ac.j...
** バグ、改善案の報告 [#y2e1ac77]
- [[GitHub の Issues>https://github.com/ku-nlp/jumanpp/is...
終了行:
* 日本語形態素解析システム Juman++ [#l6dc5533]
Juman++は言語モデルを利用した高性能な形態素解析システムで...
** 使用方法 [#zfb55bba]
たとえば,次のようなテキストを入力すると,
% cat sample.txt
外国人参政権
私もあさって日曜最終日
以下の解析結果が得られます.
% cat sample.txt | jumanpp
外国 がいこく 外国 名詞 6 普通名詞 1 * 0 * 0 "代表表記:...
人 じん 人 名詞 6 普通名詞 1 * 0 * 0 "代表表記:人/じん ...
@ 人 ひと 人 名詞 6 普通名詞 1 * 0 * 0 "代表表記:人/ひと...
参政 さんせい 参政 名詞 6 サ変名詞 2 * 0 * 0 "代表表記:...
権 けん 権 名詞 6 普通名詞 1 * 0 * 0 "代表表記:権/けん ...
EOS
私 わたし 私 名詞 6 普通名詞 1 * 0 * 0 "代表表記:私/わた...
も も も 助詞 9 副助詞 2 * 0 * 0 NIL
あさって あさって あさって 名詞 6 時相名詞 10 * 0 * 0 "...
日曜 にちよう 日曜 名詞 6 時相名詞 10 * 0 * 0 "代表表記:...
最終 さいしゅう 最終だ 形容詞 3 * 0 ナノ形容詞 22 語幹 1...
日 ひ 日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:日/ひ 漢字...
@ 日 にち 日 名詞 6 時相名詞 10 * 0 * 0 "代表表記:日/に...
EOS
詳しい使い方はマニュアルを参照してください.
なお,リソースファイルは定期的に更新し,本ページにて最新...
&br;
** 動作環境 [#be3e2f71]
- OS: Linux( Cent OS 6.7 で動作を確認)
- メモリ: 4GB以上
- ディスク: 2GB以上の空き容量
** 必須ツール・ライブラリ [#cbd0ac7b]
- gcc (4.9 以降)
- Boost C++ Libraries (1.57 以降)
&br;
** ダウンロード [#baf6ff29]
- [[Juman++ V2の開発版>https://github.com/ku-nlp/jumanpp]...
//- [[JUMAN++ Ver.1.00:https://nlp.ist.i.kyoto-u.ac.jp/DL...
//- [[JUMAN++ Ver.1.01:https://nlp.ist.i.kyoto-u.ac.jp/DL...
- [[JUMAN++ Ver.1.02:https://nlp.ist.i.kyoto-u.ac.jp/DLco...
//- [[JUMAN++ マニュアル v1.00:https://nlp.ist.i.kyoto-u....
- [[JUMAN++ マニュアル v1.01:https://nlp.ist.i.kyoto-u.ac...
- [[発表資料:https://nlp.ist.i.kyoto-u.ac.jp/DLcounter/li...
*** 旧バージョン [#t1a2609e]
- [[JUMAN++ Ver.1.01:https://nlp.ist.i.kyoto-u.ac.jp/DLco...
- [[JUMAN++ Ver.1.00:https://nlp.ist.i.kyoto-u.ac.jp/DLco...
** 部分アノテーション [#w80dff32]
本システムでは,明らかな解析の誤りについては専門的な知識...
作成した部分アノテーションは以下のページで共有,公開する...
- [[部分アノテーション共有ページ:https://lotus.kuee.kyoto...
** 更新履歴 [#z9dc3378]
- 1.02 - 2017/1/12 辞書構築時の不具合を修正,Wiktionary ...
- 1.01 - 2016/9/29 不具合を修正
- 1.00 - 2016/9/23 公開
- 1.0p - 2016/9/16 preview版公開
&br;
** ライセンス [#e4a2a08d]
- [[Apache License, Version 2.0:http://www.apache.org/lic...
** 参考文献 [#e31ad48f]
- Hajime Morita, Daisuke Kawahara and Sadao Kurohashi: Mo...
- 森田一, 黒橋 禎夫: RNN 言語モデルを用いた日本語形態素解...
** デモ [#u26250d1]
- [[Juman++を試してみる:http://tulip.kuee.kyoto-u.ac.jp/d...
//- [[JUMAN++を試してみる:https://lotus.kuee.kyoto-u.ac.j...
** バグ、改善案の報告 [#y2e1ac77]
- [[GitHub の Issues>https://github.com/ku-nlp/jumanpp/is...
ページ名: