Hi,
wer kennt das Problem nicht. - Ein frischer Datensatzkandidat für eine DB-Tabelle kommt rein und man kann nicht ausschliessen, dass der Kandidat ein zweites Mal in die Tabelle gelangt Doppelerfassung), weil z.B. die Schreibweise eines Zeichenketten-Datenfeldes, typischerweise ein Name, abweicht: "Allianz AG" ist nicht gleich "ALLIANZ"
"Mein" DB(M)S "MS SQL Server" ist da hilfreich mit den Funktionen "Soundex" und "Difference", die nicht an Deutsche Bedürfnisse angepasst sind.
Frage:
Kennt jemand einen guten ANSI SQL-Algo. für Deutsche (und ggf. andere mitteleuropäische) Bedürfnisse angepasst oder einen guten für TSQL?
Gruss,
Lude