Gunnar Bittersmann: HTML-Zeichenreferenz

Beitrag lesen

@@dedlfix:

nuqneH

Das lässt sich ändern: http://wiki.selfhtml.org/wiki/Doku:Grundlagen/Zeichenkodierung_und_geschriebene_Sprache

Autsch, was muss man da lesen: „Bei 1-Byte-Codierungen (für Zeichensätze mit bis zu 256 Zeichen) spielt die Unterscheidung zwischen Zeichensatz und Zeichencodierung keine praktische Rolle.“

Das ist Unsinn. Aber wie du sagtest: Das lässt sich ändern.

„Der Zeichensatz für HTML-Dokumente ist seit Version 4.0 stets Unicode.“

Eben. Aber „[d]as bedeutet nicht, dass alle HTML- und XML-Dokumente als Unicode codiert werden müssen […]“ [DOC-CHARSET] Auch bei einem ISO-8859-1-codierten HTML-4-Dokument ist der Zeichensatz Unicode.

Die Unterscheidung zwischen Zeichensatz und Zeichencodierung spielt immer eine Rolle.

Es gibt praktisch keine für die polnischen Nicht-ASCII/-ISO-8859-1-Zeichen.

Was denn nun: Nicht-ASCII oder Nicht-ISO-8859-1? Wenn erstes: ó

Qapla'

--
Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
(Mark Twain)