ニュース

以下の論文が言語処理学会第29回年次大会優秀賞を受賞しました。 (2023/3)

  • 稲葉達郎, 清丸寛一, Fei Cheng, 黒橋禎夫:
    大規模言語モデルに基づく複数の外部ツールを利用した推論フレームワーク

以下の論文が言語処理学会第29回年次大会若手奨励賞を受賞しました。 (2023/3)

  • 渡邉幸暉, 村脇有吾, 黒橋禎夫:
    ニューラル分類器の予測の解釈に基づく集団に特徴的なテキスト表現の抽出:アメリカ人を例に
  • 加藤駿弥, 栗田修平, Chenhui Chu, 黒橋禎夫:
    ARKitSceneRefer: 3D屋内シーンでの参照表現による小物の位置特定
  • 松田思鵬, Yin Jou Huang, 清丸寛一, 黒橋禎夫:
    Utilizing Pseudo Dialogue in Conversational Semantic Frame Analysis

以下の論文が言語処理学会第29回年次大会委員特別賞を受賞しました。 (2023/3)

  • 植田暢大, 波部英子, 湯口彰重, 河野誠也, 川西康友, 黒橋禎夫, 吉野幸一郎:
    実世界における総合的参照解析を目的としたマルチモーダル対話データセットの構築

ICASSP2023 (2023/6)で以下の論文発表を行います。

  • Qianying Liu, Zhuo Gong, Zhengdong Yang, Yuhang Yang, Sheng Li, Chenchen Ding, Nobuaki Minematsu, Hao Huang, Fei Cheng, Chenhui Chu, Sadao Kurohashi:
    Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition
  • Kak Soky, Sheng Li, Chenhui Chu, Tatsuya Kawahara:
    Domain and Language Adaptation Using Heterogeneous Datasets for Wav2vec2.0-based Speech Recognition of Low-resource Language

EACL2023 (2023/5)で以下の論文発表を行います。

  • Zhuoyuan Mao and Tetsuji Nakagawa:
    LEALLA: Learning Lightweight Language-agnostic Sentence Embedding with Knowledge Distillation
  • Qianying Liu, Wenyu Guan, Jianhao Shen, Fei Cheng and Sadao Kurohashi:
    ComSearch: Equation Searching with Combinatorial Strategy for Solving Math Word Problems with Weak Supervision
  • Zhen Wan, Fei Cheng, Qianying Liu, Zhuoyuan Mao, Haiyue Song and Sadao Kurohashi:
    Relation Extraction with Weighted Contrastive Pre-training on Distant Supervision (Findings)

研究の概要

本研究室では,言語の仕組み,それを用いたコミュニケーションの仕組みを計算機が扱える正確さで解明するという理論的研究と,それによって情報検索,自動翻訳,マンマシンインタフェース等をより高度化して人間の活動を支援するという工学的研究を行っています.(→詳細)

知識に基づく構造的言語処理の確立と知識インフラの構築

TSUBAKI.png

テキストは,専門家によるデータの分析結果や解釈,ステークホルダーの批判・意見,種々の手続きやノウハウなどが表出されたものであり,人間の知識表現の根幹をなすものです.知識に基づく頑健で高精度な構造的言語処理を実現するとともに,これによって様々なテキストの横断的な関連付け,検索,比較を可能とする知識インフラの構築を目指しています.また,注釈付与コーパス,辞書,言語解析システムの公開によって研究コミュニティによる一層の研究の加速を実現するとともに,これらの研究成果を企業のカスタマーセンター業務等に適用する実験を始めています.このようなテーマで,2013年10月から5.5年間のCRESTプロジェクトを推進しています.

自動翻訳の高度化に関する研究

EBMT.png

計算機による自動翻訳をより人間的な翻訳に近づけるために,言葉の理解・パラフレーズを通した翻訳や,大量の用例を利用した次世代翻訳方式の研究を行っています.JSTと協力し、日中科学技術文献の自動翻訳実用化プロジェクトに取り組むとともに,クラウドソーシングなどを利用した対訳コーパスの構築、自動翻訳の利用による多言語ブログからの意見集約などの研究を展開しています.

言語理解の基礎的研究

計算機による言語理解を実現するためには,計算機に常識・世界知識を与える必要があります.10年前にはこれは非常に難しい問題でしたが,近年の計算機パワー,計算機ネットワークの飛躍的進展によって計算機が超大規模テキストを取り扱えるようになり,そこから常識を自動獲得することが少しずつ可能になってきました.我々の研究室でも,クラスタ計算機を使ってWebから収集した100億文超の大規模テキストを処理することにより,同義語・類義語知識、述語項構造パターン、事態間関係知識等の自動学習を行っています.さらに,このような知識を利用することにより,計算機による文章理解,すなわち文章中の語/句/文間の関係性の解析について研究を進めています.

外部からの学生の受け入れのポリシー

修士課程

博士課程

アクセス

  • 住所/場所
    • 〒606-8501 京都市左京区吉田本町
    • 京都大学 吉田本部キャンパス 総合研究9号館(旧工学部3号館) 南棟 2階 S208
  • 連絡先
    • Tel/Fax:(075)753-5962
    • Email: contact あっと nlp.ist.i.kyoto-u.ac.jp

関連サイト


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS