JUMAN++ が解析を誤った部分文字列に対する,部分アノテーションを収集しています. 収集した部分アノテーションは,随時 JUMAN++用の学習コーパスとして,Apache 2.0 Licence で公開します.
明示的に形態素境界として指定したい箇所にタブ(\t)を挿入することで, 挿入した箇所が必ず形態素境界として解析されます. また,タブに囲まれた範囲は必ず一形態素として解析されます.
例: (「実は」の解析を誤り,1形態素としてしまう場合) この\t実\tは発芽しない