最近の自然言語処理
形態素解析は研究し尽くされてる感があってあんまおもろくないとか。係り受け解析が熱いとか。
CaboCha: Yet Another Japanese Dependency Structure Analyzer
CaboCha は, Support Vector Machines に基づく日本語係り受け解析器です. 2001年6月現在, 統計的な日本語係り受け解析器として最も精度が高い(89.29%)システムとなっています. また, バックトラックを行なわない決定的な解析アルゴリズム (Cascaded Chunking Model) を採用しており, 比較的効率の良い解析が行なえます.
サンプル見てみたけどオモロイな。係り受け解析なんてぜんぜんしらんかったよ。