言語メディア研究室のバックアップ(No.72)

ニュース †

↑

ACL2023 (2023/7)で以下の論文発表を行います。 †

Tatsuro Inaba, Hirokazu Kiyomaru, Fei Cheng and Sadao Kurohashi:
GPT-3 Can Leverage Multiple External Tools for Reasoning
Zhuoyuan Mao, Raj Dabre, Qianying Liu, Haiyue Song, Chenhui Chu and Sadao Kurohashi:
Exploring the Impact of Layer Normalization for Zero-shot Neural Machine Translation
Shuichiro Shimizu, Chenhui Chu, Sheng Li, and Sadao Kurohashi:
Towards Speech Dialogue Translation Mediating Speakers of Different Languages (Findings)
Nobuhiro Ueda, Kazumasa Omura, Takashi Kodama, Hirokazu Kiyomaru, Yugo Murawaki, Daisuke Kawahara and Sadao Kurohashi: KWJA: A Unified Japanese Analyzer Based on Foundation Models (System Demonstration)

↑

知能情報学コースの社会人向け講座、「人を知る」人工知能講座内で自然言語処理の講義・演習を行います (2023/9/8) †

↑

入試説明会後に研究室紹介を行います (2023/5/13 (土)) †

5月13日（土）に開催される知能情報学コースの入試説明会では、全体説明会のあとに研究室で個別説明会を行います。コースのサイトから事前登録をお願いします。

↑

ICASSP2023 (2023/6)で以下の論文発表を行います。 †

Qianying Liu, Zhuo Gong, Zhengdong Yang, Yuhang Yang, Sheng Li, Chenchen Ding, Nobuaki Minematsu, Hao Huang, Fei Cheng, Chenhui Chu, Sadao Kurohashi:
Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition
Kak Soky, Sheng Li, Chenhui Chu, Tatsuya Kawahara:
Domain and Language Adaptation Using Heterogeneous Datasets for Wav2vec2.0-based Speech Recognition of Low-resource Language

↑

EACL2023 (2023/5)で以下の論文発表を行います。 †

Zhuoyuan Mao and Tetsuji Nakagawa:
LEALLA: Learning Lightweight Language-agnostic Sentence Embedding with Knowledge Distillation

Qianying Liu, Wenyu Guan, Jianhao Shen, Fei Cheng and Sadao Kurohashi:
ComSearch: Equation Searching with Combinatorial Strategy for Solving Math Word Problems with Weak Supervision

Zhen Wan, Fei Cheng, Qianying Liu, Zhuoyuan Mao, Haiyue Song and Sadao Kurohashi:
Relation Extraction with Weighted Contrastive Pre-training on Distant Supervision (Findings)

過去のニュース一覧

研究の概要 †

本研究室では，言語の仕組み，それを用いたコミュニケーションの仕組みを計算機が扱える正確さで解明するという理論的研究と，それによって情報検索，自動翻訳，マンマシンインタフェース等をより高度化して人間の活動を支援するという工学的研究を行っています．(→詳細)

↑

知識に基づく構造的言語処理の確立と知識インフラの構築 †

テキストは，専門家によるデータの分析結果や解釈，ステークホルダーの批判・意見，種々の手続きやノウハウなどが表出されたものであり，人間の知識表現の根幹をなすものです．知識に基づく頑健で高精度な構造的言語処理を実現するとともに，これによって様々なテキストの横断的な関連付け，検索，比較を可能とする知識インフラの構築を目指しています．また，注釈付与コーパス，辞書，言語解析システムの公開によって研究コミュニティによる一層の研究の加速を実現するとともに，これらの研究成果を企業のカスタマーセンター業務等に適用する実験を始めています．このようなテーマで，2013年10月から5.5年間のCRESTプロジェクトを推進しています．

↑

自動翻訳の高度化に関する研究 †

計算機による自動翻訳をより人間的な翻訳に近づけるために，言葉の理解・パラフレーズを通した翻訳や，大量の用例を利用した次世代翻訳方式の研究を行っています．JSTと協力し、日中科学技術文献の自動翻訳実用化プロジェクトに取り組むとともに，クラウドソーシングなどを利用した対訳コーパスの構築、自動翻訳の利用による多言語ブログからの意見集約などの研究を展開しています．

計算機による言語理解を実現するためには，計算機に常識・世界知識を与える必要があります．10年前にはこれは非常に難しい問題でしたが，近年の計算機パワー，計算機ネットワークの飛躍的進展によって計算機が超大規模テキストを取り扱えるようになり，そこから常識を自動獲得することが少しずつ可能になってきました．我々の研究室でも，クラスタ計算機を使ってWebから収集した100億文超の大規模テキストを処理することにより，同義語・類義語知識、述語項構造パターン、事態間関係知識等の自動学習を行っています．さらに，このような知識を利用することにより，計算機による文章理解，すなわち文章中の語/句/文間の関係性の解析について研究を進めています．

外部からの学生の受け入れのポリシー †

修士課程 †

知能情報学コースの大学院入試を受験してください。近年競争率が高いことにご注意ください。

研究室のキャパシティの問題で、原則研究生は受け入れませんが、文部科学省の奨学金に応募している場合は相談に応じます。

博士課程 †

既に筆頭著者として自然言語処理のトップ会議に論文を発表している場合は相談に応じます。

英語または日本語でコミュニケーションできること。

↑

アクセス †

住所/場所
- 〒606-8501 京都市左京区吉田本町
- 京都大学吉田本部キャンパス総合研究9号館(旧工学部3号館) 南棟 2階 S208
  - 研究室へのアクセス
連絡先
- Tel/Fax:(075)753-5962
- Email: contact あっと nlp.ist.i.kyoto-u.ac.jp

↑