Lude: Algo. für Ähnlichkeiten in Zeichenketten-Datenfeldern

Beitrag lesen

Hi,

wer kennt das Problem nicht. - Ein frischer Datensatzkandidat für eine DB-Tabelle kommt rein und man kann nicht ausschliessen, dass der Kandidat ein zweites Mal in die Tabelle gelangt Doppelerfassung), weil z.B. die Schreibweise eines Zeichenketten-Datenfeldes, typischerweise ein Name, abweicht: "Allianz AG" ist nicht gleich "ALLIANZ"

"Mein" DB(M)S "MS SQL Server" ist da hilfreich mit den Funktionen "Soundex" und "Difference", die nicht an Deutsche Bedürfnisse angepasst sind.

Frage:
Kennt jemand einen guten ANSI SQL-Algo. für Deutsche (und ggf. andere mitteleuropäische) Bedürfnisse angepasst oder einen guten für TSQL?

Gruss,
Lude