技能者インタビュー対話コーパス (Expert Interview Dialog Corpus: EIDC)

EIDCは、オンラインビデオ通話を用いて、特定ドメインにおける技能者からインタビュアーが技能のコツを積極的に引き出そうとしているインタビュー対話の動画・音声・書き起こしテキスト、および各種アノテーションを付与したコーパスです。ドメインは料理・園芸ドメインから構成され、コーパスの規模は10~15分のインタビュー (i) 料理308対話 (ii) 園芸100対話です。対話の参加者として、技能者はプロか愛好家が、インタビュアーにはインタビュー経験のある者かその経験のない者が参加しています。本コーパスは、国立研究開発法人新エネルギー・産業技術総合開発機構 (NEDO) の委託業務 (JPNP20006) の結果得られたものです。

対話データの収集において、料理ドメインでは、最初の20対話が暫定的な条件で予備収集したもので (Interview_1~Interview_20)、残りの288対話は最終的な条件で本収集したものです。園芸ドメインの100対話では、料理ドメインと同等の条件で収録したものが含まれます。収集条件の詳細に関しては技術資料 [1] を参照してください。

アノテーションでは以下の情報を付与しています: (i)意味フレームに基づく技能の知識構造 (ii)コツ発話 (iii)発話意図 (iv)パラ言語情報。(i-ii) の仕様につきましては [2] を、(iii-iv) についての詳細は [3] をご参照ください。

ダウンロード

料理インタビュー対話コーパスの利用をご希望される方は、下記の利用申請フォームをご入力ください。入力されたメールアドレス宛に連絡いたします。

利用申請フォーム

各ファイルの概要

対話情報 (../meta_info/info.csv)

各種アノテーション (../annotations/)

メディアファイル・転記テキスト (../interviews_XXX-YYY/)

ライセンス

CIDCは、クリエイティブ・コモンズ 表示 - 非営利 - 継承 4.0 国際ライセンス (CC BY-NC-SA, https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja ) の下に提供されています。

参考文献

更新履歴

v.2.0 (2025/3/1):