* 研究内容 [#n6ae68ab] ** 言語理解の基礎的研究 [#pe2bad1f] #ref(黒橋・河原研究室/understanding.png,right,around) 計算機による言語理解を実現するためには,計算機に常識・世界知識を与える必要があります.10年前にはこれは非常に難しい問題でしたが,近年の計算機パワー,計算機ネットワークの飛躍的進展によって計算機が超大規模テキストを取り扱えるようになり,そこから常識を自動獲得することが少しずつ可能になってきました.我々の研究室でも,クラスター計算機を使ってwebから収集した日本語約16億文を処理することにより,日本語の述語構造のパターンを自動学習することに成功しました.このような知識を利用することにより,計算機による文章理解,すなわち文章中の語/句間の関係性の解析について研究をすすめています. - [[京都大学格フレーム]] #clear ** 自動翻訳 [#adb7bf26] #ref(黒橋・河原研究室/EBMT.png,right,around,zoom,30%) 計算機による自動翻訳をより人間的な翻訳に近づけるために,言葉の理解・パラフレーズを通した翻訳や,大量の用例を利用した次世代翻訳方式の研究を行っています.すでに旅行対話などでは実用レベルの翻訳を実現しており,特許翻訳などの専門家が利用できる翻訳支援システムの構築も行っています.平成18年度からは科学技術振興調整費による日中翻訳プロジェクトにも参加しています. - [[日中翻訳プロジェクト:http://www2.nict.go.jp/x/x161/project.html]] #clear ** 構造的言語処理による情報検索基盤技術の構築 [#xe756181] #ref(黒橋・河原研究室/TSUBAKI.png,right,around,zoom,18%) 情報検索の本来の目的は,表面的なテキストではなく,その中の情報・知識を得ることであり,そのためには計算機によるテキストの理解,言語の理解が本質的に必要となります.構造的言語処理によって,語を単位とするのではなく述語項構造を単位とし,言語表現の多様性を吸収し,クラスタリング・対話に基づく鳥瞰図的把握を提供する,次世代情報検索の基盤技術を構築しています. - [[科研情報爆発:http://i-explosion.ex.nii.ac.jp/i-explosion/index.php]] - [[開放型検索エンジン基盤 TSUBAKI:http://tsubaki.ixnlp.nii.ac.jp/]] #clear * 研究助成一覧 [#hb6af4d1] ** 2011年度(H23年度) [#haf23528] - 科学研究費補助金 基盤研究(S)「会話エージェント研究共有プラットフォームの構築と利用技術の研究」 (H19~H23,研究代表者 西田豊明,研究分担者 黒橋) - CREST 研究領域「共生社会に向けた人間調和型情報技術の構築」 「マルチモーダルな場の認識に基づくセミナー・会議の多層的支援環境」 (H21~H26,研究代表者 河原達也,研究分担者 黒橋) - 日仏交流促進事業SAKURA共同研究「SURVITRAJF:旅行会話のための日仏音声自動翻訳」 (H22~H24,研究代表者 黒橋) - グローバルCOE「知識循環社会のための情報学教育研究拠点」(H19~H23,事業推進担当者 黒橋) - 科学研究費補助金 若手研究(B)「大規模テキストから自動獲得した知識に基づく言語解析の精度向上」(H21~H24,研究代表者 柴田) - ヤフー株式会社 共同研究「日中・中日用例ベース機械翻訳の高度化・実用化のための開発研究」(研究代表者 黒橋) - 科学研究費補助金 若手研究(A)「言語使用の大規模観察に基づく言語知識獲得と言語解析の共深化」(H23~H25,研究代表者 河原) ** 2010年度(H22年度) (次年度継続分は除く) [#ed05ec55] - 科学研究費補助金 特定領域研究「情報爆発時代に向けた新しいIT基盤技術の研究」 計画研究「構造的言語処理による情報検索基盤技術の構築」(H19~H22,研究代表者 黒橋,研究分担者 柴田) 支援班「情報爆発に対応する新IT基盤研究支援プラットフォームの構築」(H18~22,研究代表者 安達淳,研究分担者 黒橋) - 科学技術総合推進費補助金「重要課題解決型研究等の推進 日中・中日言語処理技術の研究開発」 (H18~H22,研究代表者 井佐原均,サブテーマ責任者 黒橋) - A-STEP FS可能性発掘タイプ(シーズ顕在化)「言語解析技術のインターネット広告の基盤技術としての活用可能性の検証」 (H21~H22,研究責任者 黒橋) - NTT共同研究「次世代検索のための言語解析および言語推論の研究」(研究代表者 黒橋) ** 2009年度(H21年度) (次年度継続分は除く) [#x5503f4b] - NTT共同研究「次世代検索のための言語解析および言語推論の研究」(研究代表者 黒橋) - NEC共同研究「言語解析用語彙属性の自動抽出技術に関する研究開発」(研究代表者 黒橋) - CSK共同研究「NDLウェブアーカイブシステム機能拡張に係る調査研究」(研究代表者 黒橋) ** 2008年度(H20年度) (次年度継続分は除く) [#ic1ec933] - NTT共同研究「グローバルコミュニケーションを支える言語処理の研究」(H16~H20) ** 2007年度(H19年度) (次年度継続分は除く) [#r972f85f] - ロックウェーブ共同研究「携帯ブログのテキスト解析に関する研究」(研究代表者 黒橋) #br * 学位取得者一覧 [#pfe59a5a] - Fabien Cromieres (2011年3月)~ Using Scalable Run-Time Methods and Syntactic Structure in Corpus-Based Machine Translation - 村脇有吾 (2011年3月)~ Automatic Acquisition of Japanese Unknown Morphemes - 中澤敏明 (2010年3月)~ Fully Syntactic Example-based Machine Translation ([[概要:http://nlp.ist.i.kyoto-u.ac.jp/cue/nakazawa-cue25-201103.pdf]]) - 武田浩一 (2010年3月)~ Building Natural Language Processing Applications Using Descriptive Models ([[概要:http://nlp.ist.i.kyoto-u.ac.jp/cue/takeda-cue25-201103.pdf]]) - 笹野遼平 (2009年3月; 東京大学大学院情報理工学系研究科)~ Japanese Anaphora Resolution Based on Automatically Acquired World Knowledge - 颯々野学 (2008年9月)~ Practical Use of Large Margin Classifiers in Natural Language Processing ([[概要:http://nlp.ist.i.kyoto-u.ac.jp/cue/sassano-cue21-200903.pdf]]) - 柴田知秀 (2007年3月; 東京大学大学院情報理工学系研究科)~ Structural Understanding of Instruction Videos by Integrating Linguistic and Visual Information - 河原大輔 (2005年7月)~ Automatic Construction of Japanese Case Frames for Natural Language Understanding ([[概要:http://nlp.ist.i.kyoto-u.ac.jp/cue/kawahara-cue16-200606.pdf]]) - 荒牧英治 (2005年3月; 東京大学大学院情報理工学系研究科)~ Formalization and Realization of Example-based Machine Translation - 鍜治伸裕 (2005年3月; 東京大学大学院情報理工学系研究科)~ Paraphrasing Written Language to Spoken Language - 清田陽司 (2004年11月)~ Dialog Navigator: A Navigation System from Vague Questions to Specific Answers based on Real-World Text Collections ([[概要:http://nlp.ist.i.kyoto-u.ac.jp/cue/kiyota-cue16-200606.pdf]]) ※ 本ページに載せている博士論文概要は,[[京都大学電気関係教室技術情報誌cue:http://www.s-ee.t.kyoto-u.ac.jp/ja/information/cue]]に掲載されたものです.