dedlfix: About: Hilfreiches und sinnfreie Krittelei

Beitrag lesen

Hi!

Warum sollte ich mich von jemanden so barsch kritisieren lassen, der selbst Unsinn schreibt? "Zeichensatz" und "Zeichensatzkodierung" verwenden viele als Synonym - da bin ich längst nicht der einzige. Und wer mich - ohne jeden hilfreichen Bezug zur Ausgangsfrage - belehren muss ohne selbst zu wissen, dass der Zeichensatz längst nicht "immer Unicode" ist, [...]

Und was wäre, wenn es doch so ist? Der Zeichensatz (= gesamte Vorrat an Zeichen) ist bei einem HTML-Dokument immer Unicode. Die Zeichenkodierung hingegen ist beispielsweise UTF-8 oder ISO-8859-1 sein. Nur so kann man trotz ISO-8859-1 Zeichen verwenden, die mit dieser Zeichenkodierung gar nicht repräsentierbar sind. Mit den Ersatzschreibweisen NCR (€) oder Entity-Referenz (€) bekommt man sie doch noch ins Dokument.

Gerade hier ist das Verständnis vom Unterschied zwischen Zeichensatz und Zeichenkodierung wichtig.

Lo!