[日本語] /
[English]
京都大学
大学院情報学研究科
知能情報学コース
言語メディア分野(
工学部電気電子工学科
)
研究室へのアクセス
Top
メンバー
研究紹介
研究内容
研究助成一覧
学位取得者一覧
研究発表一覧
2024年度
2023年度
2022年度
2021年度
2020年度
2019年度
2018年度
2017年度
2016年度
2015年度
2014年度
2013年度
2012年度
2011年度
2010年度
2009年度
2008年度
2007年度
2006年度
NLPリソース
===ツール===
日本語解析器KWJA
形態素解析システムJUMAN
形態素解析システムJuman++
構文解析システムKNP
┗ PyKNP
解析結果汎用表示ツール
機械翻訳システムKyotoEBMT
===データ===
京大テキストコーパス
京大ウェブ文書リードコーパス
京大格フレーム
京大名詞格フレーム
日本語Wikipedia入力誤りデータ
基本料理知識ベース
BERT日本語Pretrainedモデル
RTE評価データ
日英中基本文データ
日本語SNLI(JSNLI)データセット
京都大学常識推論データセット
述部意味関係コーパス
ASPEC
SCTB
CTB5.0 Re-annotation
CTB5 chara POS annotation
TriTechDict
内部ページ
開始行:
* 京都大学ウェブ文書リードコーパス [#k21e3183]
本コーパスは、さまざまなウェブ文書のリード(冒頭)3文に各種...
言語情報としては、形態素・固有表現・構文・格関係、照応・...
** ダウンロード [#i6326d09]
*** コーパス [#h45e8db1]
- GitHubリポジトリ: https://github.com/ku-nlp/KWDLC
- 過去のバージョン
-- 京都大学ウェブ文書リードコーパス Version 1.0 (bzip2圧...
// ※ ダウンロードするには、お名前とメールアドレスを入力し...
// - [[京都大学ウェブ文書リードコーパス Version 1.0:https...
// &color(red){[New!]};
*** マニュアル [#e2ad73e1]
- [[形態素・構文情報のタグ付け基準マニュアル:https://nlp....
- [[格関係、照応・省略関係、共参照情報のタグ付け基準マニ...
- [[談話関係のタグ付け基準マニュアル:https://nlp.ist.i.ky...
※ これらのマニュアルはコーパスのパッケージにも同梱されて...
** 更新履歴 [#n84b0b68]
- GitHubに移行 - 2019/11/6
- 1.0 - 2016/6/9公開
** 文献情報 [#c62c4b59]
- 萩行正嗣, 河原大輔, 黒橋禎夫.~
多様な文書の書き始めに対する意味関係タグ付きコーパスの構...
自然言語処理, Vol.21, No.2, pp.213-248, 2014.
- Daisuke Kawahara, Yuichiro Machida, Tomohide Shibata, S...
Rapid Development of a Corpus with Discourse Annotations ...
In Proceedings of the 25th International Conference on Co...
- Masatsugu Hangyo, Daisuke Kawahara and Sadao Kurohashi.~
Building a Diverse Document Leads Corpus Annotated with S...
In Proceedings of the 26th Pacific Asia Conference on Lan...
- 岸本裕大, 村脇有吾, 河原大輔, 黒橋禎夫.~
日本語談話関係解析:タスク設計・談話標識の自動認識・ コー...
自然言語処理, Vol.27, No.4, pp.889-931, 2020.
** 謝辞 [#q837c98d]
本コーパスの作成には、科学研究費補助金 基盤研究(B)「多様...
** 問い合わせ先 [#o03d5d32]
本コーパスの不具合等は[[GitHubのIssues>https://github.com...
終了行:
* 京都大学ウェブ文書リードコーパス [#k21e3183]
本コーパスは、さまざまなウェブ文書のリード(冒頭)3文に各種...
言語情報としては、形態素・固有表現・構文・格関係、照応・...
** ダウンロード [#i6326d09]
*** コーパス [#h45e8db1]
- GitHubリポジトリ: https://github.com/ku-nlp/KWDLC
- 過去のバージョン
-- 京都大学ウェブ文書リードコーパス Version 1.0 (bzip2圧...
// ※ ダウンロードするには、お名前とメールアドレスを入力し...
// - [[京都大学ウェブ文書リードコーパス Version 1.0:https...
// &color(red){[New!]};
*** マニュアル [#e2ad73e1]
- [[形態素・構文情報のタグ付け基準マニュアル:https://nlp....
- [[格関係、照応・省略関係、共参照情報のタグ付け基準マニ...
- [[談話関係のタグ付け基準マニュアル:https://nlp.ist.i.ky...
※ これらのマニュアルはコーパスのパッケージにも同梱されて...
** 更新履歴 [#n84b0b68]
- GitHubに移行 - 2019/11/6
- 1.0 - 2016/6/9公開
** 文献情報 [#c62c4b59]
- 萩行正嗣, 河原大輔, 黒橋禎夫.~
多様な文書の書き始めに対する意味関係タグ付きコーパスの構...
自然言語処理, Vol.21, No.2, pp.213-248, 2014.
- Daisuke Kawahara, Yuichiro Machida, Tomohide Shibata, S...
Rapid Development of a Corpus with Discourse Annotations ...
In Proceedings of the 25th International Conference on Co...
- Masatsugu Hangyo, Daisuke Kawahara and Sadao Kurohashi.~
Building a Diverse Document Leads Corpus Annotated with S...
In Proceedings of the 26th Pacific Asia Conference on Lan...
- 岸本裕大, 村脇有吾, 河原大輔, 黒橋禎夫.~
日本語談話関係解析:タスク設計・談話標識の自動認識・ コー...
自然言語処理, Vol.27, No.4, pp.889-931, 2020.
** 謝辞 [#q837c98d]
本コーパスの作成には、科学研究費補助金 基盤研究(B)「多様...
** 問い合わせ先 [#o03d5d32]
本コーパスの不具合等は[[GitHubのIssues>https://github.com...
ページ名: