google もしかして レーベンシュタイン距離
googleサーチとかで”もしかして”という単語の候補が挙げられる。あれを実現させるには、単語の置き換えコストを最小にするといったレーベンシュタイン距離計算というのを用いると似たものが作れる。
情報理論分野では1965年で比較的新しい計算方法である。 PHPではすでに関数が標準で装備されているので簡単に検索システムに組み込むことができる。 …組み込もうかな・・・?
ちなみに関数名は levenshtein(いくつかの引数)
※参考文献
・レーベンシュタイン距離(wikipedia)
http://ja.wikipedia.org/wiki/%E3%83%AC%E3%83%BC%E3%83%99%E3%83%B3%E3%82%B7%E3%83%A5%E3%82%BF%E3%82%A4%E3%83%B3%E8%B7%9D%E9%9B%A2
・PHPpro:レーベンシュタイン関数サンプル
http://www.phppro.jp/phpmanual/php/function.levenshtein.html
トラックバック URL :
コメント (6941)