ChrisB: About: Hilfreiches und sinnfreie Krittelei

Beitrag lesen

Hi,

Der Zeichensatz (= gesamte Vorrat an Zeichen) ist bei einem HTML-Dokument immer Unicode.

Nö. Abhängig von der gewählten Codierung ist als "der Zeichensatz" erst einmal der Vorrat an Zeichen zu betrachten, der mit in der gewählten Kodierung ohne Krücken wie Entities übertragbar ist. Und das ist bei ISO 8859-2 eben nicht "UTF".  "UTF" gibt es nicht Zeichensatz.

Hat niemand behauptet.

Es gibt aber "Universal Character Set" mit dem Akronym ("UCS").

Eben - und das ist weitgehend identisch mit Unicode.

http://en.wikipedia.org/wiki/Universal_Character_Set#Differences_between_ISO_10646_and_Unicode:
“ISO 10646 and Unicode have an identical repertoire and numbers — the same characters with the same numbers exist on both standards. The difference between them is that Unicode adds rules and specifications that are outside the scope of ISO 10646.”

HTML 4.01 Specification, 5.1 The Document Character Set:
“The ASCII character set is not sufficient for a global information system such as the Web, so HTML uses the much more complete character set called the Universal Character Set (UCS), defined in [ISO10646]. This standard defines a repertoire of thousands of characters used by communities all over the world.
The character set defined in [ISO10646] is character-by-character equivalent to Unicode ([UNICODE]). Both of these standards are updated from time to time with new characters, and the amendments should be consulted at the respective Web sites. In the current specification, "[ISO10646]" is used to refer to the document character set while "[UNICODE]" is reserved for references to the Unicode bidirectional text algorithm.”

An dieser Stelle könnte man jetzt vielleicht Korinthen kacken, wenn man wollte - aber trotzdem würde ich die Aussage von dedlfix,

Der Zeichensatz (= gesamte Vorrat an Zeichen) ist bei einem HTML-Dokument immer Unicode.

deshalb nicht als falsch bezeichnen.

MfG ChrisB

--
RGB is totally confusing - I mean, at least #C0FFEE should be brown, right?