Sven Rautenberg: Noch mehr Zufälle in UTF-8 oder in ISO?

Beitrag lesen

Moin!

»» In Formularen kann man den das erwartete Encoding spezifizieren (accept-charset).

Versprich dir nicht zu viel davon. Es gab da mal irgendwo einen Test, der ergab, dass dieses Attribut ziemlich oft ignoriert wird. Am wahrscheinlichsten ist immer noch, dass der Browser die Formulardaten in der Kodierung des das Formular enthalten Dokuments versendet.

Jein - das Attribut wird beachtet, macht aber aus den Formulardaten in der Regel Datenmüll, den man serverseitig nicht mehr ordentlich auseinanderfummeln kann.

Die Sache ist eigentlich recht einfach: Wenn die Seite in ISO-8859-1 ist, ist es erwartungskonform, wenn das Formular auch ISO-8859-1 zurücksendet, weil die Applikation damit offenbar umgehen kann - und alle anderen Zeichen außerhalb dieser Codierung werden dann eben unbrauchbar (was sich je nach Browser unterschiedlich äußern kann).

Ist die Seite in UTF-8, darf das Formular UTF-8 zurücksenden, weil die Applikation damit offenbar umgehen kann. Bonus dieses Falls ist, dass alle eingebbaren Zeichen codiert werden können, und somit keine Verluste eintreten.

Deshalb: Immer UTF-8 verwenden, damit hat man am wenigsten Probleme.

- Sven Rautenberg