研究内容 †
言語理解の基礎的研究 †
計算機による言語理解を実現するためには,計算機に常識・世界知識を与える必要があります.10年前にはこれは非常に難しい問題でしたが,近年の計算機パワー,計算機ネットワークの飛躍的進展によって計算機が超大規模テキストを取り扱えるようになり,そこから常識を自動獲得することが少しずつ可能になってきました.我々の研究室でも,クラスタ計算機を使ってWebから収集した100億文超の大規模テキストを処理することにより,同義語・類義語知識、述語項構造パターン、事態間関係知識等の自動学習を行っています.さらに,このような知識を利用することにより,計算機による文章理解,すなわち文章中の語/句/文間の関係性の解析について研究を進めています.
知識に基づく構造的言語処理の確立と知識インフラの構築 †
テキストは,専門家によるデータの分析結果や解釈,ステークホルダーの批判・意見,種々の手続きやノウハウなどが表出されたものであり,人間の知識表現の根幹をなすものです.知識に基づく頑健で高精度な構造的言語処理を実現するとともに,これによって様々なテキストの横断的な関連付け,検索,比較を可能とする知識インフラの構築を目指しています.また,注釈付与コーパス,辞書,言語解析システムの公開によって研究コミュニティによる一層の研究の加速を実現するとともに,これらの研究成果を企業のカスタマーセンター業務等に適用する実験を始めています.このようなテーマで,2013年10月から5.5年間のCRESTプロジェクトを推進しています.
自動翻訳の高度化に関する研究 †
計算機による自動翻訳をより人間的な翻訳に近づけるために,言葉の理解・パラフレーズを通した翻訳や,大量の用例を利用した次世代翻訳方式の研究を行っています.JSTと協力し、日中科学技術文献の自動翻訳実用化プロジェクトに取り組むとともに,クラウドソーシングなどを利用した対訳コーパスの構築、自動翻訳の利用による多言語ブログからの意見集約などの研究を展開しています.
研究助成一覧 †
2015年度(H27年度) †
- COI STREAM「活力ある生涯のためのLast 5Xイノベーション」拠点,「日常生活バイタルモニタリングにおける、融合コーパスを用いたヘルスケアサービスの構築」(H25〜H30,研究分担者 黒橋)
- CREST 研究領域「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」「知識に基づく構造的言語処理の確立と知識インフラの構築」 (H25〜H30,研究代表者 黒橋)
- 学術研究助成基金助成金 挑戦的萌芽研究「Webコンテンツのメタデータ自動付与に基づくシンボルグラウンディング」(H25~H27,研究代表者 河原)
- さきがけ 研究領域「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」「計算機・人の知を統合したビッグテキスト解析基盤」 (H26〜H29,研究代表者 河原)
- ヤフー株式会社 共同研究「モバイル環境における言語処理基盤技術に関する研究開発」(研究代表者 黒橋)
- NTT共同研究「深層学習手法に基づく談話解析とその応用」(研究代表者 黒橋)
2014年度(H26年度) (次年度継続分は除く) †
- 科学研究費補助金 基盤研究(B)「多様なテキストへの高次アノテーションに基づく文脈理解モデルの明確化 」 (H24~H26,研究代表者 黒橋, 研究分担者 河原)
- 学術研究助成基金助成金 基盤研究(C)「Webから獲得した言語知識をベースとするインタラクティブな外国語学習法の開発」(H24~H26,研究代表者 野澤元(京都外国語大学), 研究分担者 河原)
- ヤフー株式会社 共同研究「用例ベース機械翻訳の高度化・実用化のための開発研究」(研究代表者 黒橋)
- NTT共同研究「知的情報処理の基盤となる事態間反義・矛盾知識の自動構築に関する研究」(研究代表者 黒橋)
2013年度(H25年度) (次年度継続分は除く) †
- 科学研究費補助金 若手研究(A)「言語使用の大規模観察に基づく言語知識獲得と言語解析の共深化」(H23~H25,研究代表者 河原)
- CREST 研究領域「共生社会に向けた人間調和型情報技術の構築」
「マルチモーダルな場の認識に基づくセミナー・会議の多層的支援環境」 (H21~H26,研究代表者 河原達也,研究分担者 黒橋)
- ヤフー株式会社 共同研究「用例ベース機械翻訳の高度化・実用化のための開発研究」(研究代表者 黒橋)
- NTT共同研究「言語表現の多様性に頑健な情報抽出に関する研究」(研究代表者 黒橋)
- NEC共同研究「Web上のオープンデータからの多言語対訳辞書構築手法の研究」(研究代表者 黒橋)
2012年度(H24年度) (次年度継続分は除く) †
- 科学研究費補助金 若手研究(B)「大規模テキストから自動獲得した知識に基づく言語解析の精度向上」(H21~H24,研究代表者 柴田)
- ヤフー株式会社 共同研究「日中・中日用例ベース機械翻訳の高度化・実用化のための開発研究」(H23〜H24, 研究代表者 黒橋)
- NTT共同研究「言語表現の多様性に頑健な情報抽出に関する研究」(研究代表者 黒橋)
- NEC共同研究「Web情報からの新語の自動獲得技術に関する研究開発」(研究代表者 黒橋)
2011年度(H23年度) (次年度継続分は除く) †
- 科学研究費補助金 基盤研究(S)「会話エージェント研究共有プラットフォームの構築と利用技術の研究」 (H19~H23,研究代表者 西田豊明,研究分担者 黒橋)
- 日仏交流促進事業SAKURA共同研究「SURVITRAJF:旅行会話のための日仏音声自動翻訳」 (H22~H23,研究代表者 黒橋)
- グローバルCOE「知識循環社会のための情報学教育研究拠点」(H19~H23,事業推進担当者 黒橋)
- NTT共同研究「次世代検索のための言語解析および言語推論の研究」(研究代表者 黒橋)
- NEC共同研究「文脈情報を用いた情報抽出技術に関する研究開発」(研究代表者 黒橋)
2010年度(H22年度) (次年度継続分は除く) †
- 科学研究費補助金 特定領域研究「情報爆発時代に向けた新しいIT基盤技術の研究」
計画研究「構造的言語処理による情報検索基盤技術の構築」(H19~H22,研究代表者 黒橋,研究分担者 柴田)
支援班「情報爆発に対応する新IT基盤研究支援プラットフォームの構築」(H18~22,研究代表者 安達淳,研究分担者 黒橋)
- 科学技術総合推進費補助金「重要課題解決型研究等の推進 日中・中日言語処理技術の研究開発」 (H18~H22,研究代表者 井佐原均,サブテーマ責任者 黒橋)
- A-STEP FS可能性発掘タイプ(シーズ顕在化)「言語解析技術のインターネット広告の基盤技術としての活用可能性の検証」 (H21~H22,研究責任者 黒橋)
- NTT共同研究「次世代検索のための言語解析および言語推論の研究」(研究代表者 黒橋)
- NEC共同研究「言語解析用語彙属性の自動抽出技術に関する研究開発」(研究代表者 黒橋)
2009年度(H21年度) (次年度継続分は除く) †
- NTT共同研究「次世代検索のための言語解析および言語推論の研究」(研究代表者 黒橋)
- NEC共同研究「言語解析用語彙属性の自動抽出技術に関する研究開発」(研究代表者 黒橋)
- CSK共同研究「NDLウェブアーカイブシステム機能拡張に係る調査研究」(研究代表者 黒橋)
2008年度(H20年度) (次年度継続分は除く) †
- NTT共同研究「グローバルコミュニケーションを支える言語処理の研究」(H16~H20)
2007年度(H19年度) (次年度継続分は除く) †
- ロックウェーブ共同研究「携帯ブログのテキスト解析に関する研究」(研究代表者 黒橋)
学位取得者一覧 †
- John Richardson (2016年9月)
Improving Statistical Machine Translation with Target-Side Dependency Syntax (概要)
- Gongye Jin (2016年3月)
High-quality Knowledge Acquisition of Predicate-argument Structures for Syntactic and Semantic Analysis (概要)
- Mo Shen (2016年3月)
Exploiting Vocabulary, Morphological, and Subtree Knowledge to Improve Chinese Syntactic Analysis (概要)
- Chenhui Chu (2015年3月)
Integrated Parallel Data Extraction from Comparable Corpora for Statistical Machine Translation (概要)
- 後藤功雄 (2014年5月)
Word Reordering for Statistical Machine Translation via Modeling Structural Differences between Languages (概要)
- 萩行正嗣 (2014年3月)
Studies on Annotated Diverse Corpus Construction and Zero Reference Resolution in Japanese (概要)
- 泉朋子 (2014年1月)
Normalization and Similarity Recognition of Complex Predicate Phrases Based on Linguistically-Motivated Evidence (概要)
- 原島純 (2013年3月)
Studies on Re-ranking and Summarizing Search Results (概要)
- 橋本力 (2011年9月)
Knowledge Acquisition from the Web for Text Understanding (概要)
- Fabien Cromieres (2011年3月)
Using Scalable Run-Time Methods and Syntactic Structure in Corpus-Based Machine Translation (概要)
- 村脇有吾 (2011年3月)
Automatic Acquisition of Japanese Unknown Morphemes (概要)
- 中澤敏明 (2010年3月)
Fully Syntactic Example-based Machine Translation (概要)
- 武田浩一 (2010年3月)
Building Natural Language Processing Applications Using Descriptive Models (概要)
- 笹野遼平 (2009年3月; 東京大学大学院情報理工学系研究科)
Japanese Anaphora Resolution Based on Automatically Acquired World Knowledge
- 颯々野学 (2008年9月)
Practical Use of Large Margin Classifiers in Natural Language Processing (概要)
- 柴田知秀 (2007年3月; 東京大学大学院情報理工学系研究科)
Structural Understanding of Instruction Videos by Integrating Linguistic and Visual Information
- 河原大輔 (2005年7月)
Automatic Construction of Japanese Case Frames for Natural Language Understanding (概要)
- 荒牧英治 (2005年3月; 東京大学大学院情報理工学系研究科)
Formalization and Realization of Example-based Machine Translation
- 鍜治伸裕 (2005年3月; 東京大学大学院情報理工学系研究科)
Paraphrasing Written Language to Spoken Language
- 清田陽司 (2004年11月)
Dialog Navigator: A Navigation System from Vague Questions to Specific Answers based on Real-World Text Collections (概要)
※ 本ページに載せている博士論文概要は,京都大学電気関係教室技術情報誌cueに掲載されたものです.