Der Martin: Konsolenchat für Linux (MSN, IRC etc)

Beitrag lesen

Hallo,


Nur ein Test: ä ß Üü ö


Dann kommt:
Fehler
Falsche oder fehlende Daten. Die Daten scheinen in irgendeiner Weise manipuliert worden zu sein.

natürlich: Der Server, der ja die POST-Daten UTF-8-codiert erwartet, bekommt etwas, das zwar in ISO-sonstwas korrekte Umlaute wären, in UTF-8 aber fehlerhafte Codes.

Aber was viel interessanter ist, dass dann im Antworttextarea der Quelltext der Seite erscheint, kurios so ein Verhalten.
Könnt Ihr das reproduzieren?

Ich kann es sogar erklären.
Das letzte Zeichen in der textarea sei meinetwegen das ISO-ö, als 0xF6. Danach kommt die öffnende spitze Klammer des </textarea>. Als UTF-8 interpretiert bedeutet 0xF6 nun, dass dies das erste Byte eines mit 4 Bytes codierten Zeichens ist. Von der Codierungsvorschrift her müssten die nächsten 3 Bytes nun alle im Bereich [0x80..0xBF] liegen. Das tun sie aber nicht, also wird das Zeichen als fehlerhaft erkannt, und der Browser sieht nie ein Ende der textarea.

So long,
 Martin

--
Paradox ist, wenn der Innenminister sich äußert und der Außenminister sich erinnert.