[日本語] /
[English]
京都大学
大学院情報学研究科
知能情報学コース
言語メディア分野(
工学部電気電子工学科
)
研究室へのアクセス
Top
メンバー
研究紹介
研究内容
研究助成一覧
学位取得者一覧
研究発表一覧
2024年度
2023年度
2022年度
2021年度
2020年度
2019年度
2018年度
2017年度
2016年度
2015年度
2014年度
2013年度
2012年度
2011年度
2010年度
2009年度
2008年度
2007年度
2006年度
NLPリソース
===ツール===
日本語解析器KWJA
形態素解析システムJUMAN
形態素解析システムJuman++
構文解析システムKNP
┗ PyKNP
解析結果汎用表示ツール
機械翻訳システムKyotoEBMT
===データ===
京大テキストコーパス
京大ウェブ文書リードコーパス
京大格フレーム
京大名詞格フレーム
日本語Wikipedia入力誤りデータ
基本料理知識ベース
BERT日本語Pretrainedモデル
RTE評価データ
日英中基本文データ
日本語SNLI(JSNLI)データセット
京都大学常識推論データセット
述部意味関係コーパス
ASPEC
SCTB
CTB5.0 Re-annotation
CTB5 chara POS annotation
TriTechDict
内部ページ
開始行:
* KNP:照応解析結果書式 [#w3edc13a]
KNPによる照応解析の結果は、-tab出力において、基本句(+で始...
- EID
- 述語項構造
それぞれについて以下で説明します。
*** EID [#la07fcba]
- 照応解析オプション(-anaphora)を指定するとすべての基本句...
例) <EID:2>
- EIDは共参照関係にある基本句には同じIDが付与されます。
- EIDは0から始まり新しく談話要素(entity)が出現するごとに1...
*** 述語項構造 [#s3da8c95]
- 照応解析オプション(-anaphora)を指定すると解析対象語に述...
- 書式は[[格解析結果の出力フォーマット>KNP/格解析結果書式...
- 全体の書式: <述語項構造:格フレームID:格要素群>
例) <述語項構造:飲む/のむ:動1:ガ/N/麻生太郎/1;ヲ/C/コー...
- 格フレームIDの書式: 代表表記:用言の種類+格フレーム番号
例) 飲む/のむ:動1
- 格要素群は格ごとに';'で区切られます。各格要素の書式: 格...
例) ガ/N/麻生太郎/1、ヲ/C/コーヒー/2
- 格解析結果と違い、格要素の基本句番号、何文前かを記述し...
- フラグの書式は[[格解析結果の出力フォーマット>KNP/格解析...
C: 直接係り受けをもつ格要素 (格は明示されている)
N: 直接係り受けをもつ格要素 (格は明示されていない:未格,...
O: 省略の指示対象
** 解析例 [#p2fc30bf]
- 入力文: 麻生太郎はコーヒーを買って飲んだ。
- オプション: -simple -anaphora -ne
- 解析結果
# S-ID:1 KNP:4.1-CF1.1 DATE:2013/11/30 SCORE:-16.31767
* 3D <体言><係:未格>
+ 1D <係:文節内><体言><NE内:PERSON><EID:0>
麻生 あそう 麻生 名詞 6 人名 5 * 0 * 0 "人名:日本:姓:135...
+ 4D <体言><係:未格><NE:PERSON:麻生太郎><EID:1>
太郎 たろう 太郎 名詞 6 人名 5 * 0 * 0 "人名:日本:名:45:...
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
* 3D <体言><係:ヲ格>
+ 4D <体言><係:ヲ格><EID:2>
コーヒー こーひー コーヒー 名詞 6 普通名詞 1 * 0 * 0 "代...
を を を 助詞 9 格助詞 1 * 0 * 0 NIL
* 3D <用言:動><係:連用>
+ 4D <用言:動><係:連用><EID:3><述語項構造:買う/かう:動2:...
買って かって 買う 動詞 2 * 0 子音動詞ワ行 12 タ系連用テ...
* -1D <用言:動><係:文末>
+ -1D <用言:動><係:文末><EID:4><述語項構造:飲む/のむ:動1...
飲んだ のんだ 飲む 動詞 2 * 0 子音動詞マ行 9 タ形 10 "代...
。 。 。 特殊 1 句点 1 * 0 * 0 NIL
EOS
終了行:
* KNP:照応解析結果書式 [#w3edc13a]
KNPによる照応解析の結果は、-tab出力において、基本句(+で始...
- EID
- 述語項構造
それぞれについて以下で説明します。
*** EID [#la07fcba]
- 照応解析オプション(-anaphora)を指定するとすべての基本句...
例) <EID:2>
- EIDは共参照関係にある基本句には同じIDが付与されます。
- EIDは0から始まり新しく談話要素(entity)が出現するごとに1...
*** 述語項構造 [#s3da8c95]
- 照応解析オプション(-anaphora)を指定すると解析対象語に述...
- 書式は[[格解析結果の出力フォーマット>KNP/格解析結果書式...
- 全体の書式: <述語項構造:格フレームID:格要素群>
例) <述語項構造:飲む/のむ:動1:ガ/N/麻生太郎/1;ヲ/C/コー...
- 格フレームIDの書式: 代表表記:用言の種類+格フレーム番号
例) 飲む/のむ:動1
- 格要素群は格ごとに';'で区切られます。各格要素の書式: 格...
例) ガ/N/麻生太郎/1、ヲ/C/コーヒー/2
- 格解析結果と違い、格要素の基本句番号、何文前かを記述し...
- フラグの書式は[[格解析結果の出力フォーマット>KNP/格解析...
C: 直接係り受けをもつ格要素 (格は明示されている)
N: 直接係り受けをもつ格要素 (格は明示されていない:未格,...
O: 省略の指示対象
** 解析例 [#p2fc30bf]
- 入力文: 麻生太郎はコーヒーを買って飲んだ。
- オプション: -simple -anaphora -ne
- 解析結果
# S-ID:1 KNP:4.1-CF1.1 DATE:2013/11/30 SCORE:-16.31767
* 3D <体言><係:未格>
+ 1D <係:文節内><体言><NE内:PERSON><EID:0>
麻生 あそう 麻生 名詞 6 人名 5 * 0 * 0 "人名:日本:姓:135...
+ 4D <体言><係:未格><NE:PERSON:麻生太郎><EID:1>
太郎 たろう 太郎 名詞 6 人名 5 * 0 * 0 "人名:日本:名:45:...
は は は 助詞 9 副助詞 2 * 0 * 0 NIL
* 3D <体言><係:ヲ格>
+ 4D <体言><係:ヲ格><EID:2>
コーヒー こーひー コーヒー 名詞 6 普通名詞 1 * 0 * 0 "代...
を を を 助詞 9 格助詞 1 * 0 * 0 NIL
* 3D <用言:動><係:連用>
+ 4D <用言:動><係:連用><EID:3><述語項構造:買う/かう:動2:...
買って かって 買う 動詞 2 * 0 子音動詞ワ行 12 タ系連用テ...
* -1D <用言:動><係:文末>
+ -1D <用言:動><係:文末><EID:4><述語項構造:飲む/のむ:動1...
飲んだ のんだ 飲む 動詞 2 * 0 子音動詞マ行 9 タ形 10 "代...
。 。 。 特殊 1 句点 1 * 0 * 0 NIL
EOS
ページ名: