Textual Entailment 評価データ

近年、RTE(Recognizing Textual Entailment)に関する研究が盛んに行われています。英語では、共通の評価データを用いてワークショップが開かれ、RTEの技術が進歩してきています。しかし、日本語ではそのような評価データが存在しません。そこで、我々は日本語のRTE評価データを作成しました。

評価データは約2700セットからなり、それぞれに4値の推論判定を付与しています。また、それぞれの評価セットを、包含、語彙(体言)、語彙(用言)、構文、推論の5つのカテゴリに分類しています。以下に例をあげます。

15 語彙(体言):下位→上位 ◎ あの人は呼吸器専門医だ。 あの人は医者だ。

1行が1セットで、カラムはスペース区切りになっており、それぞれのカラムは以下を表しています。

詳しくは以下の[小谷2008]の2節を参照下さい。また、[小谷2009]では我々が開発している推論認識システムをこの評価セットを用いて評価しています。

ダウンロード

ご意見、ご質問は shibata あっと i.kyoto-u.ac.jp 宛にお願いいたします。

参考文献


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS