Gunnar Bittersmann: Zeilenumbruch erzwingen

Beitrag lesen

Hello out there!

Mir scheint, dass du mit den Begrifflichkeiten noch nicht richtig klarkommst.

Mir scheint, dass das auch auf dich zutrifft.

Unter Zeichensatz (englisch: charset) versteht man eine Vorschrift zum Zuweisen eines Wertes zu einem Zeichen.

Nein, das ist die Zeichencodierung.

Real existierende Zeichensätze tragen Namen wie ISO-8859-1, GB2312 […]

Das sind Zeichencodierungen.

[…] oder Unicode.

_Das_ ist ein Zeichensatz. Er entspricht dem Universal _Character Set_ (UCS) nach ISO/IEC 10646.

UTF-8 etc. ist eine Vorschrift,

– also eine Zeichencodierung –

wie man Unicode-Werte auf einzelne Bytes abbildet, also kein eigener Zeichensatz.

Eben. UTF-8 ist eine Zeichencodierung.

Die Zeichen in einem Dokument sind in einem bestimmten Zeichensatz kodiert.

Nein, sondern in einer bestimmten Zeichencodierung. Der Zeichensatz für HTML-Dokumente ist _immer_ UCS.

welche Kodierung vorliegt, oder anders gesagt: welcher Zeichensatz verwendet wurde.

Nochmals: Zeichencodierung und Zeichensatz sind keine Sysnonyme.

See ya up the road,
Gunnar

--
“Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)