言語資源活用ワークショップ(国立国語研究所、3月7日〜8日)で
ポスター発表をしました。タイトルは、
『現代日本語書き言葉均衡コーパス』に
対する節の意味分類情報アノテーション
-基準策定、仕様書作成の必要性について-
というもので、松本理美(立命館大学大学院生)さん、
浅原正幸さん(国立国語研究所准教授)との共同発表でした。
内容はこちらを参照ください。
松本さんは、私のゼミ生で、2017年3月、言語教育情報研究科
修士課程修了です。
この発表は、『現代日本語書き言葉均衡コーパス』に対し、
人手による節境界アノテーション・節の意味分類タグ付け作業をした
結果出てきた問題点を整理したものです。
節認定・タグ付け箇所・意味分類のいずれにも判断の揺れが生じる
ことを許容したうえで、人手による作業だからこそ可能となる判断の
許容範囲の探求を試み、作業者間、あるいは解析器と人間の間に生じた
齟齬の分析により技術的、理論的な問題を明らかにすること目的と
しました。
と、いいながらも、浅原さんの的確な指導に応えた松本さんの功績が
大きく、私は、名ばかりの第三著者でした。
ポスター会場で、自然言語処理の研究者のお一人から、「非常に
おもしろい、もっと詳しく知りたい、こういう内容こそ言語処理学会で
発表するべきだ」みたいなことを言われ、松本さんと思わずガッツポーズ
をしました。
0 件のコメント:
コメントを投稿