ニュース

2013/10/01

  • 黒橋教授が研究代表者をつとめるCREST「知識に基づく構造的言語処理の確立と知識インフラの構築」(ビッグデータ基盤領域)がスタートしました。研究員を募集しています(JREC-IN)。
  • 村脇特定助教が九州大学田中研究室の助教として転出しました。
  • 修士一回生が1人新たに配属されました。

2013/09/21-22

  • 研究室旅行で東尋坊に行きました。
    tojinbo.JPG

2013/08/26

  • EMNLP2013(10/18-21)で以下の論文発表を行います:
    • M. Hangyo, et al.: Japanese Zero Reference Resolution Considering Exophora and Author/Reader Mentions
    • R. Sasano, et al.: Automatic Knowledge Acquisition for Case Alternation between the Passive and Active Voices in Japanese

2013/07/15

  • IJCNLP2013(10/14-19)で以下の論文発表を行います:
    • M. Shen, et al.: Chinese Word Segmentation by Mining Maximized Substrings
    • Y. Murawaki, et al.: Global Model for Hierarchical Multi-Label Text Classification
    • J. Richardson, et al.: Robust Transliteration Mining from Comparable Corpora with Bilingual Topic Models
    • D. Kawahara, et al.: Precise Information Retrieval Exploiting Predicate-Argument Structures
    • G. Jin, et al.: High Quality Dependency Selection from Automatic Parses
    • C. Chu, et al.: Accurate Parallel Fragment Extraction from Quasi–Comparable Corpora using Alignment Model and Translation Lexicon

研究の概要

本研究室では,言語の仕組み,それを用いたコミュニケーションの仕組みを計算機が扱える正確さで解明するという理論的研究と,それによって情報検索,自動翻訳,マンマシンインタフェース等をより高度化して人間の活動を支援するという工学的研究を行っています.(→詳細)

構造的言語処理による情報検索基盤技術の構築

TSUBAKI.png

情報検索の本来の目的は,表面的なテキストではなく,その中の情報・知識を得ることであり,そのためには計算機によるテキストの理解,言語の理解が本質的に必要となります.構造的言語処理によって,語を単位とするのではなく述語項構造を単位とし,言語表現の多様性を吸収し,クラスタリング・対話に基づく鳥瞰図的把握を提供する,次世代情報検索の基盤技術を構築しています.

自動翻訳

EBMT.png

計算機による自動翻訳をより人間的な翻訳に近づけるために,言葉の理解・パラフレーズを通した翻訳や,大量の用例を利用した次世代翻訳方式の研究を行っています.すでに旅行対話などでは実用レベルの翻訳を実現しており,特許翻訳などの専門家が利用できる翻訳支援システムの構築も行っています.

言語理解の基礎的研究

計算機による言語理解を実現するためには,計算機に常識・世界知識を与える必要があります.10年前にはこれは非常に難しい問題でしたが,近年の計算機パワー,計算機ネットワークの飛躍的進展によって計算機が超大規模テキストを取り扱えるようになり,そこから常識を自動獲得することが少しずつ可能になってきました.我々の研究室でも,クラスター計算機を使ってWebから収集した日本語約70億文を処理することにより,日本語の述語項構造のパターンを自動学習することに成功しました.このような知識を利用することにより,計算機による文章理解,すなわち文章中の語/句間の関係性の解析について研究をすすめています.

アクセス

関連サイト


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS