- 追加された行はこの色です。
- 削除された行はこの色です。
#author("2022-10-11T17:09:29+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab")
* 日本語解析器 KWJA [#i4c6e6fe]
#author("2023-06-14T10:27:15+09:00","default:kurohashi_kawahara_lab","kurohashi_kawahara_lab")
* KWJA: Kyoto-Waseda Japanese Analyzer [#i4c6e6fe]
KWJA は汎用言語モデルに基づく高精度な統合的日本語解析器です.
以下の解析をコマンドひとつで実行できます.
- タイポ修正
- 分かち書き
- 単語正規化
- 形態素解析
- 固有表現認識
- 言語素性付与
- 係り受け解析
- 述語項構造解析
- 橋渡し照応解析
- 共参照解析
- 談話関係解析
詳しくは GitHub レポジトリ([[https://github.com/ku-nlp/kwja>https://github.com/ku-nlp/kwja]])をご覧ください.またこちらのデモページ([[https://lotus.kuee.kyoto-u.ac.jp/kwja/index>https://lotus.kuee.kyoto-u.ac.jp/kwja/index]])にて KWJA によるテキスト解析をお試しいただけます.
** 使用方法 [#e99bc0e2]
テキストの解析
$ kwja --text "KWJAは日本語の統合解析ツールです。様々な言語解析を統一的な方法で解いています。"
テキストファイルの解析
$ echo "KWJAは日本語の統合解析ツールです。様々な言語解析を統一的な方法で解いています。" > path/to/file.txt
$ kwja --file path/to/file.txt
** 動作環境 [#vdd211ee]
- Python 3.8 以上
** インストール [#fe77556d]
$ pip install kwja
** 更新履歴 [#o61df8e4]
- 1.1.0 - 2022/10/11 インタラクティブモードの追加, Python 3.8 に対応
- 1.0.0 - 2022/9/28 公開