Andreas-Lindig: mySQL-Fulltext mit base-64 überlisten - gute Idee?

Beitrag lesen

Anderer Ansatz à la URL-encoding:

[...]

gute Idee.

Problem: Du nimmst hierbei explizit eine Codierung an (meistens wohl ISO-8859-1 oder -15).

also, ich speichere im Moment in utf-8 ab. Der Datensatz der DB ist aber ISO-8859-1, wenn ich das richtig sehe. Also meine Umlaute stehen da jetzt in zwei bis drei Zeichen codiert...

In der Regel stört das nicht, aber wenn das Projekt zu sehr wächst und mal nach Osteuropa muß, hast Du erstmal verloren.

...müßte es bei utf-8 nicht auch mit den Ossis klappen?

Ich habe noch nicht ganz verstanden, welches Problem Du meinst. Bleistift: Ich speichere ü als _FC. In Kyrillisch ist das so'n k mit Haken drauf. Wenn das Projekt aber in Kyrillien benutzt wird, dann würde doch von vornherein die Maskierungsfunktion auf die entsprechenden Zeichen umgestellt. Also schon beim reinschreiben nicht "ersetze ü durch _FC", sondern "ersetze k mit Haken drauf durch _FC".

Btw., weil ich mich im Moment soviel mit diesen Zeichensatzgeschichten beschäftige: wenn ich hier auf deutschem Grund und Boden in meine Tastatur ein ü hacke, schickt die Tastatur dann an meinen Rechner ein ü oder eine 252? Und wenn sie eine 252 schickt, schickt dann nicht die Tastatur des Kyrilliers, wenn er auf dieses k mit Haken haut, auch eine 252 ab? Wenn es mir also gelingt immer die Zahl zu speichern, die wirklich abgeschickt wurde, bin ich dann nicht aus dem Schneider?

Gruß, Andreas

--
<img src="http://was-ist-das.andreas-lindig.de/was_ist_das_fetzen.jpg" border="0" alt="">
hier könnte auch ruhig mal'n neues Bild stehen.