やってみる

アウトプットすべく己を導くためのブログ。その試行錯誤すらたれ流す。

SQLite3コア関数 soundex

 soundexエンコード文字列を返す。英語用。SQLITE_SOUNDEXコンパイルオプションがなかったので使えず。

構文

select soundex(英語文字列);
soundexエンコード文字列

select soundex('I');
select soundex('eye');
Error: no such function: soundex
Error: no such function: soundex

soundexって何?

 発音が近いかどうか判定するらしい。

 レーベンシュタイン距離によって、どれくらい近いかを算出するんだって。レーベンシュタインは人名らしい。日本語用アルゴリズムを誰かが作ったら「山田太郎距離」とかになるのかな?

なぜ日本語版はないの?

 あっても困るから? 同音異義語を拾いまくって何か意味があるのか。索引に使える? それもうただ漢字をひらがなにしただけで、soundexとは別の概念と思われる。

 それとも、いいまつがいとか、タイポとか、かみまみた的なヤツも検索できるとか? それ要る? あと、間違いと発音が似ているというのは、明らかに別物。

 日本語では価値がない? だから無いのかな。

対象環境

$ uname -a
Linux raspberrypi 4.19.42-v7+ #1218 SMP Tue May 14 00:48:17 BST 2019 armv7l GNU/Linux

前回まで