#author("2021-03-16T19:11:29+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab") #author("2021-03-16T19:16:08+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab") * 日本語談話関係解析 [#pbd5d6c8] 談話関係解析は自然言語処理の基盤的な解析の一つですが、日本語におけるコーパスベースの談話関係解析の研究はほとんどありません。 本ページでは日本語の談話関係解析を実用化するためのコーパスと、談話関係解析器を公開しています。 ** ダウンロード [#i6326d09] *** コーパス [#h45e8db1] - 京都大学ウェブ文書リードコーパス(KWDLC): [[GitHubリポジトリ>https://github.com/ku-nlp/KWDLC]] *** ツール [#u682021d] - KNP: [[GitHubリポジトリ>https://github.com/ku-nlp/KNP]]~ ※ 基本句に付与される 節featureを利用することで談話単位と談話標識の自動認識ができます。 - 日本語談話解析器: 整備中 *** マニュアル [#e2ad73e1] - [[談話関係のタグ付け基準マニュアル>http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/corpus/KWDLC-1.0/doc/disc_guideline.pdf]]~ ※ このマニュアルはKWDLCのパッケージにも同梱されています。 - [[KNPに付与される節featureについて>http://nlp.ist.i.kyoto-u.ac.jp/local/nlp/documents/KNP_clause_feature_manual.pdf]] ** 更新履歴 [#pd7e8d4b] - 2020/10/16 ページ公開 ** 文献情報 [#h603dc2e] - 岸本 裕大, 村脇 有吾, 河原 大輔 , 黒橋 禎夫.~ 日本語談話関係解析: タスク設計・談話標識の自動認識・コーパスアノテーション,~ 自然言語処理, Vol.27, No.4, pp.889-931, 2020. - Yudai Kishimoto, Shinnosuke Sawada, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.~ Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations,~ In Proceedings of the 11th Edition of its Language Resources and Evaluation Conference, pp.4044-4048, 2018. - Daisuke Kawahara, Yuichiro Machida, Tomohide Shibata, Sadao Kurohashi, Hayato Kobayashi and Manabu Sassano.~ Rapid Development of a Corpus with Discourse Annotations using Two-stage Crowdsourcing, ~ In Proceedings of the 25th International Conference on Computational Linguistics, pp.269-278, 2014. - Yudai Kishimoto, Shinnosuke Sawada, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi.~ Improving Crowdsourcing-Based Annotation of Japanese Discourse Relations,~ In Proceedings of the 11th Edition of its Language Resources and Evaluation Conference, pp.4044-4048, 2018.. //** 謝辞 [#q837c98d] //本コーパスの作成には、科学研究費補助金 基盤研究(B)「多様なテキストへの高次アノテーションに基づく文脈理解モデルの明確化 」(研究課題番号:24300053, 研究代表者: 黒橋禎夫)、および科学技術振興機構 CREST 研究領域「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」「知識に基づく構造的言語処理の確立と知識インフラの構築」 (研究代表者: 黒橋禎夫)の助成を受けました。また、クラウドソーシングを利用した談話関係のアノテーションは、ヤフー株式会社の支援の元に行いました。ここに謝意を表します。 ** 問い合わせ先 [#d447ce4a] 本コーパスに関するご意見、ご質問は nl-resource あっと nlp.ist.i.kyoto-u.ac.jp宛にお願いいたします。コーパスに含まれる文書への典拠情報の付与、文書の削除などをご希望の場合にもこのメールアドレスにご連絡をお願いします。