Axel Hoogestraat: MSSQL Dubletten suchen

Beitrag lesen

Hallo,

ob der SOUNDEX-Algorhytmus wirklich nur Vokale rauskickt und dann vergleicht? http://www.google.de/search?hl=de&q=soundex+algorythm&meta=

Mir ist gerade aufgefallen, dass es bei PHP (nicht SQL) neben dem soundex auch noch einen Alghorithmus gibt, der "Metaphone" heisst. Der scheint tatsächlich die Vokale rausnehmen. Aber auch nicht ausschliesslich (der hängt dann nch irgendwas dran).
Soundex macht das auf jeden Fall nicht.
Select Soundex('test') ergbit sowas wie 'T260'

Ein Kollege von mir hat zu diesem Zweck ein kleines Rudel Zeichenkettenfunktionen geschrieben. D.h. es duerfte mit den Bordmitteln von T-SQL (DIFFERENCE() faellt mir gerade noch ein) schwer werden.

Den Eindruck bekomme ich auch langsam. Ich denke, ich werde dann auch alle Kunden einlesen und die Dublettenprüfung mit PHP-Funktinonen machen (soundex, metaphone, similar_text und/oder levenshtein).
Auch wenn die Bearbeitung dann sicher länger dauert.

Vielen Dank an Euch
Schöne Grüße
Axel