Hallo,
Ich halte die Unterscheidung von Zeichensatz und Zeichencodierung schon seit jeher für Unsinn (für mich gehört beides untrennbar zusammen) und mache mir daher gar nicht erst die Mühe, das zu unterscheiden.
Vielleicht solltest du damit anfangen und dir die Mühe machen, sonst lässt sich nämlich gar nichts davon verstehen, was Gunnar an deinem Posting korrigiert hat.
Im Übrigen ist die Unterscheidung ziemlich trivial:
Ein Zeichensatz (wie Unicode) ist eine Liste, die gewissen Zeichen erst einmal Nummern zuweist. Dann sind in dieser Liste noch viele weitere Informationen zu den Zeichen gespeichert, sodass Unicode letztlich eine riesige Datenbank ist.
Eine Kodierung beschreibt, wie man mit Nullen und Einsen diese Zeichen (genauer gesagt deren Unicode-Nummern) kodiert, also im Computer darstellt und speichert. Je nach Kodierung können nur einige bis alle Zeichen aus Unicode kodiert werden (Zeichenvorrat).
Natürlich gehört beides zusammen, aber erst die Unterscheidung lässt verstehen, wie numerische Zeichenreferenzen in (X)HTML/XML unabhängig von der jeweiligen Dokumentkodierung funktionieren - sie verweisen nämlich auf den Zeichenvorrat von Unicode als mögliche Zeichen in (X)HTML/XML-Dokumenten und auf die in Unicode festgesetzten Zeichennummern (Codes).
Eigentlich kann der Begriff »Zeichensatz« sterben, SELFHTML habe ich z.B. so modifiziert, dass nur noch von Zeichen-/Codetabellen, Kodierungen und Zeichenvorrat einer Kodierung die Rede ist. Der Dreischritt sollte dadurch noch immer ersichtlich sein:
1. Nummerierung aller Zeichen der Welt,
2. Auswahl von Zeichen, die mit der Kodierung kodiert werden sollen (ggf. neue, kleinere Codetabelle mit neuen Nummern/Codes, die wiederum auf Unicode verweist),
2. ein Kodierungsalgorithmus, der diese Nummern in Nullen und Einsen (Bytes) übersetzt, sodass sie wieder eindeutig dekodiert, auf die Codetabelle der Kodierung und somit auf Unicode abgebildet werden können.
Mathias