ニュース

Jivnesh Sandhan特定研究員が着任しました。 (2024/12/1)

大文字山に登りました。(11/27)

daimonzi_20241127.jpg

EMNLP 2024 (2024/11)で以下の論文発表を行います。

  • Yin Jou Huang, Rafik Hadfi:
    How Personality Traits Influence Negotiation Outcomes? A Simulation based on Large Language Models (Findings)
  • Junfeng Jiang, Fei Cheng, Akiko Aizawa:
    Improving Referring Ability for Biomedical Language Models (Findings)

昨年度博士後期課程卒業の毛卓遠君の以下の博士論文がAAMT長尾賞 学生奨励賞を受賞しました(2024/5)。

  • Breaking Language Barriers: Enhancing Multilingual Representation for Sentence Alignment and Translation

ACL 2024 (2024/8)で以下の論文発表を行います。

  • Sirou Chen, Sakiko Yahata, Shuichiro Shimizu, Zhengdong Yang, Yihang Li, Chenhui Chu, Sadao Kurohashi:
    MELD-ST: An Emotion-aware Speech Translation Dataset (Findings)
  • Yahan Yu, Duzhen Zhang, Xiuyi Chen, Chenhui Chu:
    Flexible Weight Tuning and Weight Fusion Strategies for Continual Named Entity Recognition (Findings)
  • Duzhen Zhang, Yahan Yu, Chenxing Li, Jiahua Dong, Dan Su, Chenhui Chu, Dong Yu:
    MM-LLMs: Recent Advances in MultiModal Large Language Models (Findings)
  • Zhen Wan, Yating Zhang, Yexiang Wang, Fei Cheng, Sadao Kurohashi:
    Reformulating Domain Adaptation of Large Language Models as Adapt-Retrieve-Revise: A Case Study on Chinese Legal Domain (Findings)

入試説明会後に研究室紹介を行います (2024/5/11 (土))

  • 5月11日(土)に開催される知能情報学コースの入試説明会では、全体説明会のあとに研究室でオープンラボ・個別説明会を行います。15:00頃開始と16:00頃開始の2セッションを予定しています。

以下の論文が2023年度 言語処理学会 論文賞を受賞しました。 (2024/3)

  • 大村 和正, 河原 大輔, 黒橋 禎夫:
    基本イベントに基づく常識推論データセットの構築と利用

LREC-COLING 2024 (2024/5)で以下の論文発表を行います。

  • Taishi Chika, Taro Okahisa, Takashi Kodama, Yin Jou Huang, Yugo Murawaki and Sadao Kurohashi:
    Domain Transferable Semantic Frames for Expert Interview Dialogues
  • Yikun Sun, Zhen Wan, Nobuhiro Ueda, Sakiko Yahata, Fei Cheng, Chenhui Chu and Sadao Kurohashi:
    Rapidly Developing High-quality Instruction Data and Evaluation Benchmark for Large Language Models with Minimal Human Effort: A Case Study on Japanese
  • Norizo Sakaguchi, Yugo Murawaki, Chenhui Chu and Sadao Kurohashi:
    Identifying Source Language Expressions for Pre-editing in Machine Translation
  • Nobuhiro Ueda, Hideko Habe, Yoko Matsui, Akishige Yuguchi, Seiya Kawano, Yasutomo Kawanishi, Sadao Kurohashi and Koichiro Yoshino: J-CRe3:
    A Japanese Conversation Dataset for Real-world Reference Resolution
  • Hao Wang, Tang Li, Chenhui Chu, Rui Wang and Pinpin Zhu:
    Towards Human-Like Machine Comprehension: Few-Shot Relational Learning in Visually-Rich Documents
  • Rikito Takahashi, Hirokazu Kiyomaru, Chenhui Chu and Sadao Kurohashi:
    Abstractive Multi-Video Captioning: Benchmark Dataset Construction and Extensive Evaluation
  • Yugo Murawaki:
    Principal Component Analysis as a Sanity Check for Bayesian Phylolinguistic Reconstruction
  • Kazumasa Omura, Fei Cheng and Sadao Kurohashi:
    An Empirical Study of Synthetic Data Generation for Implicit Discourse Relation Recognition
  • Xiaotian Lu, Jiyi Li, Zhen Wan, Xiaofeng Lin, Koh Takeuchi and Hisashi Kashima:
    Evaluating Saliency Explanations in NLP by Crowdsourcing
  • Francois Meyer, Haiyue Song, Abhisek Chakrabarty, Jan Buys, Raj Dabre and Hideki Tanaka:
    NGLUEni: Benchmarking and Adapting Pretrained Language Models for Nguni Languages

研究の概要

本研究室では,言語の仕組み,それを用いたコミュニケーションの仕組みを計算機が扱える正確さで解明するという理論的研究と,それによって情報検索,自動翻訳,マンマシンインタフェース等をより高度化して人間の活動を支援するという工学的研究を行っています.(→詳細)

知識に基づく構造的言語処理の確立と知識インフラの構築

TSUBAKI.png

テキストは,専門家によるデータの分析結果や解釈,ステークホルダーの批判・意見,種々の手続きやノウハウなどが表出されたものであり,人間の知識表現の根幹をなすものです.知識に基づく頑健で高精度な構造的言語処理を実現するとともに,これによって様々なテキストの横断的な関連付け,検索,比較を可能とする知識インフラの構築を目指しています.また,注釈付与コーパス,辞書,言語解析システムの公開によって研究コミュニティによる一層の研究の加速を実現するとともに,これらの研究成果を企業のカスタマーセンター業務等に適用する実験を始めています.このようなテーマで,2013年10月から5.5年間のCRESTプロジェクトを推進しています.

自動翻訳の高度化に関する研究

EBMT.png

計算機による自動翻訳をより人間的な翻訳に近づけるために,言葉の理解・パラフレーズを通した翻訳や,大量の用例を利用した次世代翻訳方式の研究を行っています.JSTと協力し、日中科学技術文献の自動翻訳実用化プロジェクトに取り組むとともに,クラウドソーシングなどを利用した対訳コーパスの構築、自動翻訳の利用による多言語ブログからの意見集約などの研究を展開しています.

言語理解の基礎的研究

計算機による言語理解を実現するためには,計算機に常識・世界知識を与える必要があります.10年前にはこれは非常に難しい問題でしたが,近年の計算機パワー,計算機ネットワークの飛躍的進展によって計算機が超大規模テキストを取り扱えるようになり,そこから常識を自動獲得することが少しずつ可能になってきました.我々の研究室でも,クラスタ計算機を使ってWebから収集した100億文超の大規模テキストを処理することにより,同義語・類義語知識、述語項構造パターン、事態間関係知識等の自動学習を行っています.さらに,このような知識を利用することにより,計算機による文章理解,すなわち文章中の語/句/文間の関係性の解析について研究を進めています.

外部からの学生の受け入れのポリシー

黒橋教授は新規の学生の研究指導を行っていません。村脇准教授またはChu特定准教授が研究指導を行う体制です。

修士課程

博士課程

アクセス

  • 住所/場所
    • 〒606-8501 京都市左京区吉田本町
    • 京都大学 吉田本部キャンパス 総合研究9号館(旧工学部3号館) 南棟 2階 S208
  • 連絡先
    • Tel/Fax:(075)753-5962
    • Email: contact あっと nlp.ist.i.kyoto-u.ac.jp

関連サイト