MudGuard: Problem mit Entities, ISO-8859-1, UTF-16 und dem Validator!

Beitrag lesen

Hi,

Ich habe auch schon versucht, das ganze Entity Problem zu umgehen, indem ich das Dokument einfach als UTF-16, anstatt als ISO-8859-1 auszeichne. Dann kommt aber dieselbe Fehlermeldung (nur line 1), auch auf Seiten, die NUR ASCII-Code enthalten, und keine Sonderzeichen.

Argh. Nur die Tatsache, daß Du eine andere encoding-Angabe machst, ändert ja nicht das tatsächliche Encoding.

Wieso bringt der Validator das?? Ich dachte UTF-16 ist weltweit und umfasst alle Zeichen, demnach nach auch alle ASCII-Zeichen.

Du verwechselst den Zeichensatz Unicode mit einer seiner Codierungsvarianten UTF-16.

ISO-8859-1 ist doch nur eine Teilmenge von UTF-16, oder!?

Nein. ISO-8859-1 ist eine bestimmte Art der Codierung für eine 256 Zeichen große Teilmenge aus dem Unicode - jedem dieser 256 Zeichen entspricht dabei 1 Byte.
UTF-16 ist eine Art der Codierung für den kompletten Unicode, in der den meisten Zeichen 16 Bit (daher UTF-16) - also 2 Byte entsprechen.

Wenn das so ist, dann kann man seine Seiten eigentlich auch immer mit UTF-16 auszeichnen.

Nein, nur dann, wenn die entsprechenden Resourcen auch tatsächlich die entsprechende Codierung verwenden.
Aber Zeichensatz (im Gegensatz zur Codierung) ist bei HTML immer Unicode...

cu,
Andreas

--
Der Optimist: Das Glas  ist halbvoll.  - Der Pessimist: Das Glas ist halbleer. - Der Ingenieur: Das Glas ist doppelt so groß wie nötig.
http://mud-guard.de/? http://www.andreas-waechter.de/