#author("2021-03-16T19:11:29+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab")
#author("2021-03-16T19:16:08+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab")
* 日本語談話関係解析 [#pbd5d6c8]

談話関係解析は自然言語処理の基盤的な解析の一つですが、日本語におけるコーパスベースの談話関係解析の研究はほとんどありません。
本ページでは日本語の談話関係解析を実用化するためのコーパスと、談話関係解析器を公開しています。

** ダウンロード [#i6326d09]

*** コーパス [#h45e8db1]
- 京都大学ウェブ文書リードコーパス(KWDLC): [[GitHubリポジトリ>https://github.com/ku-nlp/KWDLC]]

*** ツール [#u682021d]
- KNP: [[GitHubリポジトリ>https://github.com/ku-nlp/KNP]]~
※ 基本句に付与される 節featureを利用することで談話単位と談話標識の自動認識ができます。
- 日本語談話解析器: 整備中


*** マニュアル [#e2ad73e1]
- [[談話関係のタグ付け基準マニュアル>http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/corpus/KWDLC-1.0/doc/disc_guideline.pdf]]~
※ このマニュアルはKWDLCのパッケージにも同梱されています。
- [[KNPに付与される節featureについて>http://nlp.ist.i.kyoto-u.ac.jp/local/nlp/documents/KNP_clause_feature_manual.pdf]]

** 更新履歴 [#pd7e8d4b]
- 2020/10/16 ページ公開

** 文献情報 [#h603dc2e]
- 岸本 裕大, 村脇 有吾, 河原 大輔 , 黒橋 禎夫.~
日本語談話関係解析: タスク設計・談話標識の自動認識・コーパスアノテーション,~
自然言語処理, Vol.27, No.4, pp.889-931, 2020.
- Yudai Kishimoto, Shinnosuke Sawada, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.~
Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations,~
In Proceedings of the 11th Edition of its Language Resources and Evaluation Conference, pp.4044-4048, 2018.
- Daisuke Kawahara, Yuichiro Machida, Tomohide Shibata, Sadao Kurohashi, Hayato Kobayashi and Manabu Sassano.~
Rapid Development of a Corpus with Discourse Annotations using Two-stage Crowdsourcing, ~
In Proceedings of the 25th International Conference on Computational Linguistics, pp.269-278, 2014.
- Yudai Kishimoto, Shinnosuke Sawada, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.~
Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations,~
In Proceedings of the 11th Edition of its Language Resources and Evaluation Conference,  pp.4044-4048, 2018..

//** 謝辞 [#q837c98d]
//本コーパスの作成には、科学研究費補助金 基盤研究(B)「多様なテキストへの高次アノテーションに基づく文脈理解モデルの明確化 」(研究課題番号:24300053, 研究代表者: 黒橋禎夫)、および科学技術振興機構 CREST 研究領域「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」「知識に基づく構造的言語処理の確立と知識インフラの構築」 (研究代表者: 黒橋禎夫)の助成を受けました。また、クラウドソーシングを利用した談話関係のアノテーションは、ヤフー株式会社の支援の元に行いました。ここに謝意を表します。

** 問い合わせ先 [#d447ce4a]
本コーパスに関するご意見、ご質問は nl-resource あっと nlp.ist.i.kyoto-u.ac.jp宛にお願いいたします。コーパスに含まれる文書への典拠情報の付与、文書の削除などをご希望の場合にもこのメールアドレスにご連絡をお願いします。

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS