[日本語] /
[English]
京都大学
大学院情報学研究科
知能情報学コース
言語メディア分野(
工学部電気電子工学科
)
研究室へのアクセス
Top
メンバー
研究紹介
研究内容
研究助成一覧
学位取得者一覧
研究発表一覧
2024年度
2023年度
2022年度
2021年度
2020年度
2019年度
2018年度
2017年度
2016年度
2015年度
2014年度
2013年度
2012年度
2011年度
2010年度
2009年度
2008年度
2007年度
2006年度
NLPリソース
===ツール===
日本語解析器KWJA
形態素解析システムJUMAN
形態素解析システムJuman++
構文解析システムKNP
┗ PyKNP
解析結果汎用表示ツール
機械翻訳システムKyotoEBMT
===データ===
京大テキストコーパス
京大ウェブ文書リードコーパス
京大格フレーム
京大名詞格フレーム
日本語Wikipedia入力誤りデータ
基本料理知識ベース
BERT日本語Pretrainedモデル
RTE評価データ
日英中基本文データ
日本語SNLI(JSNLI)データセット
京都大学常識推論データセット
述部意味関係コーパス
ASPEC
SCTB
CTB5.0 Re-annotation
CTB5 chara POS annotation
TriTechDict
内部ページ
開始行:
* KNPに関するFAQ [#lefdd9eb]
** 動作について [#s5abbfd8]
***複数の文からなるテキストを入力して解析できますか? [#qa...
JUMANへの入力時に一文一行にして、その解析結果をKNPに入力...
***"Can't allocate memory for ..."のようなエラーが出て止...
メモリが不足しています。2GB以上のメモリを搭載したPCで動か...
***入力文の長さに制限はありますか? [#kc5639b4]
一文の長さの上限は200形態素(300〜400文字程度)になります。...
***半角スペースを含む文が解析できないのですが。 [#tb2e3872]
JUMAN/KNPでは、入力文が全角文字で記述されていることを前提...
**出力について [#w8c09a80]
*** <体言>はどのような場合に出力されますか? [#pf36ef95]
以下は常に「体言」です.
-名詞
-特殊-記号
-指示詞-名詞形態指示詞
-接尾辞-名詞性述語接尾辞
助詞が後続するなど条件によっては,
- 副詞
- 感動詞
も「体言」になります.
詳しくは knp/rule/bnst_basic.rule の
;;;;; 用言,体言,その他の区別
と書いてある辺りを御覧ください.
*** <ID:●●●>は何を示していますか? [#v572d883]
<ID:>タグは、節の表層的なタイプを表しています。
たとえば、「~と比べると、」という節に対して、<ID:~と>を...
多少の汎化を行っており、「~と比べると」のように読点がな...
<ID:>タグの付与は、KNPのrule/bnst_type.phraseというル...
"ID:"でgrepしていただければ、どのような種類があり、どのよ...
全部で150種類程度あります。
*** <連体修飾>と<連体節>の違いは何ですか? [#m12d2476]
<連体節>もしくは<係:連格>は述語の連体形に付与しており...
それに対して、<連体修飾>は、「名詞+の」、連体詞、述語の連...
従って、<連体節>が付いていれば<連体修飾>が付いているはず...
<連体修飾>の付与ルールは、mrph_filter.ruleの<T連体修...
<T連体修飾>を元に、bnst_basic.ruleで<連体修飾>を付与...
(ちなみに、<T連体修飾>の頭の「T」は最終結果に表示しない...
*** <正規化代表表記>, <用言代表表記>は何ですか? [#r4c512ea]
- <正規化代表表記>はJUMANの解析結果から生成しています
- <用言代表表記>はKNPのルールを用いて、JUMANの解析結果か...
終了行:
* KNPに関するFAQ [#lefdd9eb]
** 動作について [#s5abbfd8]
***複数の文からなるテキストを入力して解析できますか? [#qa...
JUMANへの入力時に一文一行にして、その解析結果をKNPに入力...
***"Can't allocate memory for ..."のようなエラーが出て止...
メモリが不足しています。2GB以上のメモリを搭載したPCで動か...
***入力文の長さに制限はありますか? [#kc5639b4]
一文の長さの上限は200形態素(300〜400文字程度)になります。...
***半角スペースを含む文が解析できないのですが。 [#tb2e3872]
JUMAN/KNPでは、入力文が全角文字で記述されていることを前提...
**出力について [#w8c09a80]
*** <体言>はどのような場合に出力されますか? [#pf36ef95]
以下は常に「体言」です.
-名詞
-特殊-記号
-指示詞-名詞形態指示詞
-接尾辞-名詞性述語接尾辞
助詞が後続するなど条件によっては,
- 副詞
- 感動詞
も「体言」になります.
詳しくは knp/rule/bnst_basic.rule の
;;;;; 用言,体言,その他の区別
と書いてある辺りを御覧ください.
*** <ID:●●●>は何を示していますか? [#v572d883]
<ID:>タグは、節の表層的なタイプを表しています。
たとえば、「~と比べると、」という節に対して、<ID:~と>を...
多少の汎化を行っており、「~と比べると」のように読点がな...
<ID:>タグの付与は、KNPのrule/bnst_type.phraseというル...
"ID:"でgrepしていただければ、どのような種類があり、どのよ...
全部で150種類程度あります。
*** <連体修飾>と<連体節>の違いは何ですか? [#m12d2476]
<連体節>もしくは<係:連格>は述語の連体形に付与しており...
それに対して、<連体修飾>は、「名詞+の」、連体詞、述語の連...
従って、<連体節>が付いていれば<連体修飾>が付いているはず...
<連体修飾>の付与ルールは、mrph_filter.ruleの<T連体修...
<T連体修飾>を元に、bnst_basic.ruleで<連体修飾>を付与...
(ちなみに、<T連体修飾>の頭の「T」は最終結果に表示しない...
*** <正規化代表表記>, <用言代表表記>は何ですか? [#r4c512ea]
- <正規化代表表記>はJUMANの解析結果から生成しています
- <用言代表表記>はKNPのルールを用いて、JUMANの解析結果か...
ページ名: