#author("2024-04-03T16:48:21+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab") #author("2024-04-22T15:03:32+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab") * 自然言語処理のためのリソース [#r3bd757f] - [[Organization@GitHub>https://github.com/ku-nlp/]] - [[Team@Hugging Face Hub>https://huggingface.co/ku-nlp]] **ツール [#kd3a6b31] - [[日本語解析器 KWJA>KWJA]] - [[日本語形態素解析システムJUMAN>JUMAN]] - [[日本語形態素解析システムJuman++>JUMAN++]] - [[日本語構文解析システムKNP>KNP]] // &size(9){&color(red){[Updated!]};}; -- [[PyKNP]] (JUMANとKNPのPythonバインディング) - [[解析結果汎用表示ツール TableDisplay:http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/tabledisplay/index.cgi]] - [[KyotoEBMT:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?KyotoEBMT]] - [[Webページ変換ツール WWW2sf:https://github.com/ku-nlp/WWW2sf]] - [[検索エンジン基盤 TSUBAKI:https://github.com/ku-nlp/TSUBAKI]] -- [[Webページ構造解析モジュール DetectBlocks]] -- [[Webページ発信者候補抽出モジュール DetectSender]] **データ・コーパス [#g63a7f30] - [[京都大学テキストコーパス]] - [[京都大学ウェブ文書リードコーパス>KWDLC]] - [[京都大学格フレーム]] - [[京都大学名詞格フレーム]] // &size(9){&color(red){[New!]};}; - [[BERT日本語Pretrainedモデル>ku_bert_japanese]] - [[基本料理知識ベース]] - [[Textual Entailment 評価データ]] - [[日英中基本文データ]] - [[述部意味関係コーパス>PredicateEvalSet]] - [[Asian Scientific Paper Excerpt Corpus (ASPEC):http://orchid.kuee.kyoto-u.ac.jp/ASPEC/]] -- [[Workshop on Asian Translation (WAT):http://orchid.kuee.kyoto-u.ac.jp/WAT/]] - [[Chinese Penn Treebank 5.0 Reannotation:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?Chinese%20Penn%20Treebank%205.0%20Reannotation]] - [[Chinese Character-level POS Annotation:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?Chinese%20Character-level%20POS%20Annotation]] - [[A Chinese Treebank in Scientific Domain (SCTB):http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?A%20Chinese%20Treebank%20in%20Scientific%20Domain%20%28SCTB%29]] - [[Kyoto University & JST Trilingual Technical Term Dictionary (TriTechDict):http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?TriTechDict]] - [[Wikipedia Chinese-Japanese Parallel Corpus:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?Wikipedia%20Chinese-Japanese%20Parallel%20Corpus]] - [[健康アドバイスデータセット]] - [[FAQ Retrieval model:http://nlp.ist.i.kyoto-u.ac.jp/index.php?BERT-Based_FAQ_Retrieval]] - [[運転ドメインQAデータセット>Driving domain QA datasets]] - [[日本語Wikipedia入力誤りデータセット (JWTD)>日本語Wikipedia入力誤りデータセット]] - [[日本語SNLI(JSNLI)データセット>日本語SNLI(JSNLI)データセット]] - [[京都大学常識推論データセット>KUCI]] - [[BART日本語Pretrainedモデル]] - [[不満調査データセットタグ付きコーパス>Annotated-FKC-Corpus]] - [[オープンコースウェア対訳コーパス/Coursera Parallel Corpus:http://nlp.ist.i.kyoto-u.ac.jp/EN/edit.php?Coursera+Parallel+Corpus]] &size(9){&color(red){[New!]};}; - [[日本語映画推薦対話データセット>JMRD]] &size(9){&color(red){[New!]};}; - [[料理インタビュー対話コーパス(CIDC)>CIDC]] &size(9){&color(red){[New!]};}; - [[技術者インタビュー対話コーパス (EIDC)>EIDC]] &size(9){&color(red){[New!]};}; これらのリソースに関する御意見、御質問は、GitHub レポジトリを公開しているもの (Juman++, KNP等) は GitHub の Issues に投稿をお願いします。レポジトリを公開していないリソースについては nl-resource あっと nlp.ist.i.kyoto-u.ac.jp 宛にお願い致します。