言語メディア研究室のバックアップ(No.13)

ニュース †

↑

以下の論文が EMNLP2020 Findings に採録されます。 †

Fei Cheng, Masayuki Asahara, Ichiro Kobayashi and Sadao Kurohashi:
Dynamically Updating Event Representations for Temporal Relation Classification with Multi-category Learning
Haoran Zhang, Qianying Liu, Aysa Xuemo Fan, Heng Ji, Daojian Zeng, Fei Cheng, Daisuke Kawahara and Sadao Kurohashi:
Minimize Exposure Bias of Seq2Seq Models in Joint Entity and Relation Extraction

↑

EMNLP2020 (2020/11/8-12)で以下の論文発表を行います。 †

Kazumasa Omura, Daisuke Kawahara and Sadao Kurohashi:
A Method for Building a Commonsense Inference Dataset based on Basic Events
Yugo Murawaki:
Latent Geographical Factors for Analyzing the Evolution of Dialects in Contact

↑

以下の論文が第244回自然言語処理研究会若手奨励賞を受賞しました。 (2020/7) †

吉越卓見, 河原大輔, 黒橋禎夫:
機械翻訳を用いた自然言語推論データセットの多言語化

↑

国内の大学・研究機関の情報系研究室とのコラボレーションによって、COVID-19に関する世界の情報を集約するサイトを構築し、公開しました。(6/2) †

↑

オンライン研究室紹介を行います (2020/5/23 (土)) †

2020年8月実施予定の大学院入試の受験を考えている方を対象に、5月23日 (土) に zoom によるオンライン研究室紹介を行います。事前に参加申込フォームから申し込んでください。

↑

ACL2020SRW (2020/7)で以下の論文発表を行います。 †

Haiyue Song, Raj Dabre, Zhuoyuan Mao, Fei Cheng, Sadao Kurohashi and Eiichiro Sumita:
Pre-training via Leveraging Assisting Languages for Neural Machine Translation
Yu Tanaka, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi:
Building a Japanese Typo Dataset from Wikipedia's Revision History

過去のニュース一覧

研究の概要 †

本研究室では，言語の仕組み，それを用いたコミュニケーションの仕組みを計算機が扱える正確さで解明するという理論的研究と，それによって情報検索，自動翻訳，マンマシンインタフェース等をより高度化して人間の活動を支援するという工学的研究を行っています．(→詳細)

↑

知識に基づく構造的言語処理の確立と知識インフラの構築 †

テキストは，専門家によるデータの分析結果や解釈，ステークホルダーの批判・意見，種々の手続きやノウハウなどが表出されたものであり，人間の知識表現の根幹をなすものです．知識に基づく頑健で高精度な構造的言語処理を実現するとともに，これによって様々なテキストの横断的な関連付け，検索，比較を可能とする知識インフラの構築を目指しています．また，注釈付与コーパス，辞書，言語解析システムの公開によって研究コミュニティによる一層の研究の加速を実現するとともに，これらの研究成果を企業のカスタマーセンター業務等に適用する実験を始めています．このようなテーマで，2013年10月から5.5年間のCRESTプロジェクトを推進しています．

↑

自動翻訳の高度化に関する研究 †

計算機による自動翻訳をより人間的な翻訳に近づけるために，言葉の理解・パラフレーズを通した翻訳や，大量の用例を利用した次世代翻訳方式の研究を行っています．JSTと協力し、日中科学技術文献の自動翻訳実用化プロジェクトに取り組むとともに，クラウドソーシングなどを利用した対訳コーパスの構築、自動翻訳の利用による多言語ブログからの意見集約などの研究を展開しています．

計算機による言語理解を実現するためには，計算機に常識・世界知識を与える必要があります．10年前にはこれは非常に難しい問題でしたが，近年の計算機パワー，計算機ネットワークの飛躍的進展によって計算機が超大規模テキストを取り扱えるようになり，そこから常識を自動獲得することが少しずつ可能になってきました．我々の研究室でも，クラスタ計算機を使ってWebから収集した100億文超の大規模テキストを処理することにより，同義語・類義語知識、述語項構造パターン、事態間関係知識等の自動学習を行っています．さらに，このような知識を利用することにより，計算機による文章理解，すなわち文章中の語/句/文間の関係性の解析について研究を進めています．

↑

アクセス †

住所/場所
- 〒606-8501 京都市左京区吉田本町
- 京都大学吉田本部キャンパス総合研究9号館(旧工学部3号館) 南棟 2階 S208
  - 研究室へのアクセス
連絡先
- Tel/Fax:(075)753-5962
- Email: contact あっと nlp.ist.i.kyoto-u.ac.jp

↑