[日本語] /
[English]
京都大学
大学院情報学研究科
知能情報学コース
言語メディア分野(
工学部電気電子工学科
)
研究室へのアクセス
Top
メンバー
研究紹介
研究内容
研究助成一覧
学位取得者一覧
研究発表一覧
2024年度
2023年度
2022年度
2021年度
2020年度
2019年度
2018年度
2017年度
2016年度
2015年度
2014年度
2013年度
2012年度
2011年度
2010年度
2009年度
2008年度
2007年度
2006年度
NLPリソース
===ツール===
日本語解析器KWJA
形態素解析システムJUMAN
形態素解析システムJuman++
構文解析システムKNP
┗ PyKNP
解析結果汎用表示ツール
機械翻訳システムKyotoEBMT
===データ===
京大テキストコーパス
京大ウェブ文書リードコーパス
京大格フレーム
京大名詞格フレーム
日本語Wikipedia入力誤りデータ
基本料理知識ベース
BERT日本語Pretrainedモデル
RTE評価データ
日英中基本文データ
日本語SNLI(JSNLI)データセット
京都大学常識推論データセット
述部意味関係コーパス
ASPEC
SCTB
CTB5.0 Re-annotation
CTB5 chara POS annotation
TriTechDict
内部ページ
開始行:
*Kyoto-Tohoku-Crawlerついて [#v5a3781d]
**概要 [#e9bed4b7]
[[京都大学 黒橋・河原研究室>http://nlp.ist.i.kyoto-u.ac.j...
では、合同でウェブ上を自動的に巡回し、ウェブページを収集...
収集したウェブページは、
言語表現の分析等の研究用データとして使用します。ウェブペ...
** クローラーの詳細 [#l872b492]
「Kyoto-Tohoku-Crawler」というUser-Agentのクローラーを運...
Kyoto-Tohoku-Crawlerは以下のIPアドレスからアクセスします。
130.54.130.64/27
130.54.130.224/27
130.54.131.176/29
133.3.240.0/24
130.34.192.82/28
130.34.192.91/28
//東北大のIPアドレスをここに書く
** robots.txtについて [#i7d0c96e]
[[robots.txt>https://ja.wikipedia.org/wiki/Robots_Exclusi...
-robots.txtの例
User-agent: Kyoto-Crawler
Disallow: /
各サイトのrobots.txtは2015年10月に確認しており,それ以後...
お手数ですが,下記の連絡先にご連絡いただければ直ちに収集...
**お問い合わせ [#ufada7d2]
Kyoto-Tohoku-Crawlerは、収集先ホストに迷惑をかけないよう...
万が一、Kyoto-Tohoku-Crawlerの動作に問題がありました場合...
*** 連絡先 [#qe0ea850]
kyoto-crawler-contact あっと nlp.ist.i.kyoto-u.ac.jp
終了行:
*Kyoto-Tohoku-Crawlerついて [#v5a3781d]
**概要 [#e9bed4b7]
[[京都大学 黒橋・河原研究室>http://nlp.ist.i.kyoto-u.ac.j...
では、合同でウェブ上を自動的に巡回し、ウェブページを収集...
収集したウェブページは、
言語表現の分析等の研究用データとして使用します。ウェブペ...
** クローラーの詳細 [#l872b492]
「Kyoto-Tohoku-Crawler」というUser-Agentのクローラーを運...
Kyoto-Tohoku-Crawlerは以下のIPアドレスからアクセスします。
130.54.130.64/27
130.54.130.224/27
130.54.131.176/29
133.3.240.0/24
130.34.192.82/28
130.34.192.91/28
//東北大のIPアドレスをここに書く
** robots.txtについて [#i7d0c96e]
[[robots.txt>https://ja.wikipedia.org/wiki/Robots_Exclusi...
-robots.txtの例
User-agent: Kyoto-Crawler
Disallow: /
各サイトのrobots.txtは2015年10月に確認しており,それ以後...
お手数ですが,下記の連絡先にご連絡いただければ直ちに収集...
**お問い合わせ [#ufada7d2]
Kyoto-Tohoku-Crawlerは、収集先ホストに迷惑をかけないよう...
万が一、Kyoto-Tohoku-Crawlerの動作に問題がありました場合...
*** 連絡先 [#qe0ea850]
kyoto-crawler-contact あっと nlp.ist.i.kyoto-u.ac.jp
ページ名: