形態素解析

エロゲー批評空間掲示板でゲーム名の形態素解析なんてな話が上がってたので、やっつけ仕事でやってみるテスト。とりあえず何故かChaSenはFAQに上がってるのと違うところのコンパイルでコケるので、MeCabにて。

検索システムまで仕立てるには暇がなかったので(つか、コストファンクションとか考えないといかんし)とりあえず、分解までしてみた。ゲーム名に出てくる単語@ErogameScapeの5日2時くらいのデータ。「淫」が未知語なあたり辞書はもうちょっと鍛えないと辛いなー、ってのはあるけど、なかなか面白いデータになってますな。やはり学園つえー、とか、少女>天使>人妻>メイドなのか、とか。「天使少女学園2?はじめての青い恋、そして、どきどき甘い夏?」とかいうのがベタな感じな訳だな(ぉ