Rolf B: Datenbank-Suche mit nicht-ASCII Zeichen (Kollation?)

Beitrag lesen

Hallo Linuchs,

die Suffixe an den Collations geben an, wie sich die Collation bezüglich der Schreibung verhält. _bin bedeutet: Binary. Andere Schreibweise ist ungleich (schön vs schÖn vs Schön). _ci bedeutet: Case Insensitive, damit ist "schön"="schÖn".

MySQL unterscheidet noch die Collations utf8_general_ci und utf8_german2_ci (in meiner Installation). Der Unterschied ist, dass german2 Duden-Regeln implementiert, damit ist sogar "schoen"="schÖn" wahr.

Die _ci Collation scheint in MySQL auch die _ai Eigenschaft zu haben (accent insensitive), d.h. "schen"="schén" ist sowohl in der utf8_general_ci als auch in der utf8_german2_ci Collation wahr. (Collations mit _cs, _ai oder _as Suffix scheint es in MYSQL nicht zu geben, die kenne ich aber aus dem MS SQL Server).

Welche Collation angewendet wird, hängt von der Definition der befragten Column ab, oder von der COLLATE Option in der jeweiligen Abfrage, zum Beispiel

SELECT * 
FROM table
WHERE ding like '%schön%' COLLATE utf8_german2_ci

Rolf

--
sumpsi - posui - obstruxi