Textual Entailment 評価データのバックアップ(No.2)

Textual Entailment 評価データ †

近年、RTE(Recognizing Textual Entailment)に関する研究が盛んに行われています。英語では、共通の評価データを用いてワークショップが開かれ、RTEの技術が進歩してきています。しかし、日本語ではそのような評価データが存在しません。そこで、我々は日本語のRTE評価データを作成しました。

評価データは約2700セットからなり、それぞれに4値の推論判定を付与しています。また、それぞれの評価セットを、包含、語彙（体言）、語彙（用言）、構文、推論の5つのカテゴリに分類しています。以下に例をあげます。

15 語彙(体言):下位→上位 ◎ あの人は呼吸器専門医だ。あの人は医者だ。

1行が1セットで、カラムはスペース区切りになっており、それぞれのカラムは以下を表しています。

1カラム目 ID

2カラム目カテゴリ:サブカテゴリ

3カラム目推論判定

4カラム目テキスト

5カラム目仮説

詳しくは以下の[小谷2008]の2節を参照下さい。また、[小谷2009]では我々が開発している推論認識システムをこの評価セットを用いて評価しています。

ダウンロード †

ご意見、ご質問は shibata あっと i.kyoto-u.ac.jp 宛にお願いいたします。

参考文献 †

小谷通隆, 柴田知秀, 中田貴之, 黒橋禎夫.
日本語Textual Entailmentのデータ構築と自動獲得した類義表現に基づく推論関係の認識, 言語処理学会第14回年次大会, pp.1140-1143 (2008.3).

小谷通隆, 柴田知秀, 黒橋禎夫.
言い換え表現の述語項構造への正規化とテキスト含意関係認識での利用, 言語処理学会第15回年次大会, pp.260-263 (2009.3).