単純なコロケーションを入れてみました
ピアノ 引く サッカー する ゲーム 遊ぶ
原文:I play the game.
http://rafeel.s602.xrea.com/honyaku/?q=I+play+the+game.
collocation sort (私はゲーム遊ぶ:st) (1) (私はそのゲーム遊ぶ:st) (1) (私試合ゲーム:n) (0) (私試合そのゲーム:n) (0) (私はゲーム演奏する:st) (0) (私はそのゲーム演奏する:st) (0) (私はゲーム引く:st) (0) (私はそのゲーム引く:st) (0) (私はゲームする:st) (0) (私はそのゲームする:st) (0)
コロケーションで、ゲームと遊ぶの出現に加点されるので、上位に選出できる。
コロケーションは、ネットの膨大な文章から機械生成すれば、もし互いに文に出てくる回数が0であれば
積極的に、コロケーションを否定する方向でも使えそう。
あと、自然な文章の判定にはn-gramも使えますね。2-gramであれば、わりと簡単にデータとれそうですし。
これも判定に加えれば、例えば、
「この池」「これ池」みたいな表現で、これ池を否定できると思う。
探索中にありえない単語の並びを否定すれば、探索空間も狭くできるし