ストップワード

http://ja.wikipedia.org/wiki/Wikipedia:Common_words,_searching_for_which_is_not_possible
週末開発していた特徴的単語の検出スクリプトであるが、頻出する英単語をわざわざデータベースに登録する必要がないと気づく。上記のURLに掲載されている単語は最初から削除した上でデータベースに登録・抽出するようにしたい。これでデータベースへの負荷はかなり減るだろう。