本データセットは映画推薦を題材にした,外部知識に基づいた日本語対話データセットです. 推薦者側の発話には外部知識として映画情報が紐付けられています. 対話収集はクラウドソーシングを用いて行い,約5,000対話,平均23ターンからなるデータセットとなっています.
データの詳細はGithubをご参照ください.
データセットのダウンロードは以下のGithubリポジトリからお願いします.
Githubリポジトリ:https://github.com/ku-nlp/JMRD
GithubのIssuesへの投稿をお願いします