#author("2024-04-03T16:48:21+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab")
#author("2024-04-22T15:03:32+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab")
* 自然言語処理のためのリソース [#r3bd757f]

- [[Organization@GitHub>https://github.com/ku-nlp/]]
- [[Team@Hugging Face Hub>https://huggingface.co/ku-nlp]]

**ツール [#kd3a6b31]

- [[日本語解析器 KWJA>KWJA]]

- [[日本語形態素解析システムJUMAN>JUMAN]]

- [[日本語形態素解析システムJuman++>JUMAN++]]

- [[日本語構文解析システムKNP>KNP]]
// &size(9){&color(red){[Updated!]};};

-- [[PyKNP]] (JUMANとKNPのPythonバインディング)

- [[解析結果汎用表示ツール TableDisplay:http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/tabledisplay/index.cgi]]

- [[KyotoEBMT:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?KyotoEBMT]]

- [[Webページ変換ツール WWW2sf:https://github.com/ku-nlp/WWW2sf]]

- [[検索エンジン基盤 TSUBAKI:https://github.com/ku-nlp/TSUBAKI]]

-- [[Webページ構造解析モジュール DetectBlocks]]

-- [[Webページ発信者候補抽出モジュール DetectSender]]


**データ・コーパス [#g63a7f30]

- [[京都大学テキストコーパス]]

- [[京都大学ウェブ文書リードコーパス>KWDLC]]

- [[京都大学格フレーム]]

- [[京都大学名詞格フレーム]]
// &size(9){&color(red){[New!]};};

- [[BERT日本語Pretrainedモデル>ku_bert_japanese]]

- [[基本料理知識ベース]]

- [[Textual Entailment 評価データ]]

- [[日英中基本文データ]]

- [[述部意味関係コーパス>PredicateEvalSet]]

- [[Asian Scientific Paper Excerpt Corpus (ASPEC):http://orchid.kuee.kyoto-u.ac.jp/ASPEC/]]
-- [[Workshop on Asian Translation (WAT):http://orchid.kuee.kyoto-u.ac.jp/WAT/]]

- [[Chinese Penn Treebank 5.0 Reannotation:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?Chinese%20Penn%20Treebank%205.0%20Reannotation]]

- [[Chinese Character-level POS Annotation:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?Chinese%20Character-level%20POS%20Annotation]]

- [[A Chinese Treebank in Scientific Domain (SCTB):http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?A%20Chinese%20Treebank%20in%20Scientific%20Domain%20%28SCTB%29]]

- [[Kyoto University & JST Trilingual Technical Term Dictionary (TriTechDict):http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?TriTechDict]]

- [[Wikipedia Chinese-Japanese Parallel Corpus:http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?Wikipedia%20Chinese-Japanese%20Parallel%20Corpus]]

- [[健康アドバイスデータセット]]

- [[FAQ Retrieval model:http://nlp.ist.i.kyoto-u.ac.jp/index.php?BERT-Based_FAQ_Retrieval]]

- [[運転ドメインQAデータセット>Driving domain QA datasets]]

- [[日本語Wikipedia入力誤りデータセット (JWTD)>日本語Wikipedia入力誤りデータセット]]  

- [[日本語SNLI(JSNLI)データセット>日本語SNLI(JSNLI)データセット]]

- [[京都大学常識推論データセット>KUCI]]

- [[BART日本語Pretrainedモデル]] 

- [[不満調査データセットタグ付きコーパス>Annotated-FKC-Corpus]]

- [[オープンコースウェア対訳コーパス/Coursera Parallel Corpus:http://nlp.ist.i.kyoto-u.ac.jp/EN/edit.php?Coursera+Parallel+Corpus]] &size(9){&color(red){[New!]};};

- [[日本語映画推薦対話データセット>JMRD]] &size(9){&color(red){[New!]};};

- [[料理インタビュー対話コーパス(CIDC)>CIDC]] &size(9){&color(red){[New!]};};
- [[技術者インタビュー対話コーパス (EIDC)>EIDC]] &size(9){&color(red){[New!]};};

これらのリソースに関する御意見、御質問は、GitHub レポジトリを公開しているもの (Juman++, KNP等) は GitHub の Issues に投稿をお願いします。レポジトリを公開していないリソースについては nl-resource あっと nlp.ist.i.kyoto-u.ac.jp 宛にお願い致します。

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS