n.d. parker: Sorry, this document does not validate as HTML 4.01 Transitional

Beitrag lesen

Moin,

Du meinst, gespeichert wird in UTF-8?

jap, die CGI-Parameter werden direkt beim Eingang in UTF-8 umgewandelt und die interne Verarbeitung erfolgt als UTF-8.

Aber wie wird dann die Ausgabe erzeugt.

Es gibt eine Mapping-Table. Hauptsaechlich fuer ISO-8859-1-Zeichen (die dann in Entities umgewandelt werden). Was in bewusster Tabelle nicht auftaucht, kommt im Browser als 〹 an.

Soweit ich erkennen kann, wird nirgendwo ein Charset angegeben, duerfte demnach zu iso-8859-1 defaulten.

noe, es werden nur ASCII-Zeichen ausgegeben. Eine Charsetangabe waere nur notwendig, wenn nicht-ASCII-Zeichen uncodiert beim Browser ankommen wuerden.

btw: man kann auch UTF-8 codierte Postings abschicken...
Wenn man einen Browser hat, der das kann (und manchmal auch inkorrekterweise macht...)

mein Netscape kann das ;) (mal davon abgesehen, dass mir fuer die entsprechenden Zeichen der richtige Editor fehlt...)

Wie gesagt, die Charseterkennung ist bei weitem nicht perfekt und eigentlich auch nur geraten. Browser schicken ja bloederweise keinen Charsethinweis mit ;/
Was aber funktioniert, ist, dass UTF-7 nicht akzeptiert wird ;-)

Viele Gruesse,

n.d.p.