Hi Tom,
Ja, das Problem bleibt:
eszet also ß
plus steht vor minus
nein, nichts von alledem. Das läßt sich alles über eine collating
sequence lösen, sofern alle zu sortierenden Zeichen "gleich lang"
sind.
Aber sortiere mal "über" gegen "unter", _ohne_ die Entity vorher
umzuwandeln (egal, in welchem Zeichensatz)! Da hilft keine Tabelle mehr.
Hai Michael,
ja, das will ich nicht anweifeln, dass es da ein Problem gibt. Man müßte sich also eine Tabelle bauen (einbauen in MySQL) ind er für jedes Zeichen bzw. für jede Zeichenkombination, die man behandeln will, eine Funktion eingebaut ist. Schlußendlich muss alles wieder in einer Ordialtabelle enden. Dabei kann es passieren, dass man dan acuh leicht auf die soundex()-Funktion stösst...
Die ist nämlich so ähnlich aufgebaut.
Für die Umwandlung von Sonderzeichen in HTML gibt es in PHP ja zum Glück die Funktion htmlentities(). Aber was ist mit der Rückwandlung. Die kommt zwar nur vor, wenn ich HTML-Seiten indizieren will, aber ich trotzdem keine Funktion gefunden.
Wie ist das mit den anderen Sprachen?
Bleibt einem wieder nix anderes übrig, als auf C runterzugehen, damit die Performance nicht in die Knie geht.
Gruß
Tom