Textual Entailment 評価データ - LANGUAGE MEDIA PROCESSING LAB

Textual Entailment 評価データ †

近年、RTE(Recognizing Textual Entailment)に関する研究が盛んに行われています。英語では、共通の評価データを用いてワークショップが開かれ、RTEの技術が進歩してきています。しかし、日本語ではそのような評価データが存在しません。そこで、我々は日本語のRTE評価データを作成しました。

(注: 現在ではRITEやRITE2で日本語RTEの評価セットが公開されています。それらの評価セットは新聞やWikipediaなどの実際の文から作成されており、現在の自然言語処理技術では非常に難しい問題が多く含まれています。一方、我々の評価セットは人手で作成したもので、ほとんどの問題において表現のずれは1箇所であり、RITEやRITE2のデータに比べてやさしい問題になっています。)

評価データは約2700セットからなり、それぞれに4値の推論判定を付与しています。また、それぞれの評価セットを、包含、語彙（体言）、語彙（用言）、構文、推論の5つのカテゴリに分類しています。以下に例をあげます。

15 語彙(体言):下位→上位 ◎ あの人は呼吸器専門医だ。あの人は医者だ。

1行が1セットで、カラムはスペース区切りになっており、それぞれのカラムは以下を表しています。

1カラム目 ID

2カラム目カテゴリ:サブカテゴリ

3カラム目推論判定

4カラム目テキスト

5カラム目仮説

詳しくは以下の[小谷2008]の2節を参照下さい。また、[小谷2009]では我々が開発している推論認識システムをこの評価セットを用いて評価しています。

ダウンロード †

Textual Entailment 評価データ (12/12/15 updated, 285K)

XML版 (451K, RITE2と同じ形式)
XML版 (推論判定の◎と〇をY, △と×をNに変換) (447K, RITE2と同じ形式)
変更履歴
- 文字コードをutf-8に変更し、402番のタイポを修正しました (12/12/15)

ご意見、ご質問は shibata あっと i.kyoto-u.ac.jp 宛にお願いいたします。

参考文献 †

小谷通隆, 柴田知秀, 中田貴之, 黒橋禎夫.
日本語Textual Entailmentのデータ構築と自動獲得した類義表現に基づく推論関係の認識, 言語処理学会第14回年次大会, pp.1140-1143 (2008.3).

小谷通隆, 柴田知秀, 黒橋禎夫.
言い換え表現の述語項構造への正規化とテキスト含意関係認識での利用, 言語処理学会第15回年次大会, pp.260-263 (2009.3).