Andreas-Lindig: mySQL-Fulltext mit base-64 überlisten - gute Idee?

Beitrag lesen

Gut, ich verwende mySQL-Front. Kann scheinbar nur ISO-8859-1.
Wenn das was browserbasiertes ist, dann nicht unbedingt.

nö, ist ein richtiges Programm. Seeehr praktisch.

Aber wofür brauche ich dann den Zeichensatz der DB?

Wenn du die Datenbank aber beispielsweise fragst, wie lang der gespeicherte String denn nun ist
[...] Beispielsweise bei regulären Ausdrücken. Da kannst du ja Zeichenklassen definieren: /[a-zA-Z]/ steht für exakt EIN Zeichen (kleine oder große Buchstaben von A bis Z). Wie kriegst du da jetzt noch Umlaute mit rein?
Der Teufel liegt dann im Detail, wenn es an scriptgesteuerte Textbearbeitung geht.

*grrrmpf* - dann kann ich mir das ganze mit utf-8 jetzt abschminken oder was? Ich suche einiges mit Regulären Ausdrücken. Ich weiß jetzt nicht, ob ich z.B. alles von  [abcü] auf a|b|c|(ü) umstellen kann - meine Suche ist sehr umfangreich. "mySQL kann zur Zeit nur mit ein-Byte-Zeichensätzen umgehen" - d.h. utf-8 kann ich dort nicht intern verwenden. Wie paßt das denn jetzt mit Deiner Empfehlung weiter unten zusammen, besser konsequent bei utf-8 zu bleiben?

Es empfiehlt sich daher, im Formular selbst ein paar Indikatorzeichen in Hidden-Feldern unterzubringen. Diese werden vom Browser natürlich ebenfalls mit dem von ihm gewählten Encoding gesendet. Setzt man beispielsweise das Euro-Zeichen und einen Umlaut hinein, kann man hinterher eindeutig prüfen, ob diese Zeichen korrekt UTF-8-codiert zurückkommen.

hehe, ich meine CK hätte mal gesagt, daß das keine richtige Lösung sei. Ich habe das nicht ganz verstanden, weiß deshalb auch die Details nicht mehr. Er macht das ja auch in diesem Formular hier: da steht im hidden-Feld "ÿ> ". Leuchtet mir noch nicht ganz ein. "ÿ" wird in utf-8 zu zwei Byte ("ÿ"), aber wozu dienen ">" und " "?
Ich kann also am ersten Zeichen zumindest prüfen, ob utf-8 verschickt wurde, indem ich prüfe, ob es zwei Byte geworden sind und ggf. auch noch die zwei einzelnen Bytes auf "Ã" und "¿" prüfe. Aber, wenn _nicht_ utf-8 verschickt wurde, weiß ich ja immer noch nicht, _welcher_ Zeichensatz es denn nun war oder? "ÿ" würde dann doch immer als 255 oder xFF oder \377 - wie auch immer, aber immer mit diesem einen Byte-Wert verschickt oder? Und ob ich diese 255 nun in ISO-8859-1 oder ISO-8859-5 abspeichern muß, weiß ich doch immer noch nicht.

Die Alphabete der tolkienschen Sprachen aus "Herr der Ringe" hingegen sind im Unicode-Standard enthalten.

das finde ich sehr praktisch ;-)

Du kannst ja schließlich unter Windows (würde mich wundern, wenn Linux da versagt) mehrere Tastaturtabellen gleichzeitig installieren und mit Mausklick (oder Tastenkombi)umschalten. Dann hast du eine russische Tastaturbelegung
Das würde mich ja mal intressieren. Wie geht das?
Gehe in die Systemsteuerung, Icon "Tastatur" (oder Keyboard). Dort sollte "Deutsch" als einzige Option angezeigt werden, du kannst dann mit "Hinzufügen" weitere Tastaturbelegungen installieren.

hab ich mal gemacht. Eins verwirrt mich aber noch: man kann für eine neu installierte Sprache dann noch die "Eigenschaften" ändern. In diesem Popup stellt man das "Tastaturlayout" ein. Im Effekt heißt das, daß auf der einzelnen Taste wieder unterschiedliche Zeichen liegen. Wozu muß ich einerseits die Sprache auswählen und andererseits die Zeichen auf der Tastatur nochmals festlegen? Ich habe zum Beispiel Russisch installiert. Und wenn ich in diesen besagten "Eigenschaften" Deutsch auswähle, bekomme ich auf den UmlautTasten tatsächlich kyrillische Zeichen. Wenn ich aber eine andere Sprache wähle, bekomme ich andere Zeichen, z.T. auch kyrillische. Russisch kann ich da z.B. gar nicht wählen. Habe ich jetzt den gleichen Zeichensatz, nur anders auf der Tastatur verteilt? Auf dem Mac kann man die Tastaturbelegung auf dem Bildschirm sichtbar machen - gibt's bei Windows da auch ein Programm für?

Gruß, Andreas
-- <img src="http://was-ist-das.andreas-lindig.de/was_ist_das_fetzen.jpg" border="0" alt="">
hier könnte auch ruhig mal'n neues Bild stehen.