molily: Unicode-Darstellung von Webseiten

Beitrag lesen

Hallo,

kleine Ergänzung:

(...) In einem wirklich in ISO 8859-1 codierten Dokument dürften keine Oktetts aus dem Bereich von x80 bis x9F (Steuerzeichen) auftreten.

Naja, was heißt »dürfen nicht«? Sie dürfen nicht, weil es die SGML-Deklaration für HTML mit DESCSET (...) 128 32 UNUSED verbietet. Das heißt, U+0080 bis U+009F dürfen in keinem HTML-Dokument vorkommen, ganz gleich in welcher Kodierung.
In einem Windows-1252-kodierten Dokument werden andere Unicode-Zeichen mit 0x80 bis 0x9F kodiert, daher lässt sich Windows 1252 prinzipiell in HTML-Dokumenten nutzen.
In XML/XHTML darf man auch Windows-1252 verwenden, die Steuerzeichen aus ISO 8859-1 ebenfalls, auch wenn sie abgesehen von U+0085 zu den nicht empfohlenen Zeichen gehören.

Mathias