Hello out there!
Mir scheint, dass du mit den Begrifflichkeiten noch nicht richtig klarkommst.
Mir scheint, dass das auch auf dich zutrifft.
Unter Zeichensatz (englisch: charset) versteht man eine Vorschrift zum Zuweisen eines Wertes zu einem Zeichen.
Nein, das ist die Zeichencodierung.
Real existierende Zeichensätze tragen Namen wie ISO-8859-1, GB2312 […]
Das sind Zeichencodierungen.
[…] oder Unicode.
_Das_ ist ein Zeichensatz. Er entspricht dem Universal _Character Set_ (UCS) nach ISO/IEC 10646.
UTF-8 etc. ist eine Vorschrift,
– also eine Zeichencodierung –
wie man Unicode-Werte auf einzelne Bytes abbildet, also kein eigener Zeichensatz.
Eben. UTF-8 ist eine Zeichencodierung.
Die Zeichen in einem Dokument sind in einem bestimmten Zeichensatz kodiert.
Nein, sondern in einer bestimmten Zeichencodierung. Der Zeichensatz für HTML-Dokumente ist _immer_ UCS.
welche Kodierung vorliegt, oder anders gesagt: welcher Zeichensatz verwendet wurde.
Nochmals: Zeichencodierung und Zeichensatz sind keine Sysnonyme.
See ya up the road,
Gunnar
“Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)