Moin,
Die Encoding-Angabe spielt bei numerischen Zeichenreferenzen keine Rolle (Zeichensatz ist bei HTML immer Unicode, die numerischen Zeichensätze geben immer Unicode an). Das Encoding spielt für die direkt verwendeten Zeichen eine Rolle.
Guck an, wieder was gelernt. Wo steht das eigentlich?, Da in der Spec, wo ich es jetzt vermutet habe, steht es nicht.
Unicode als HTML-Zeichensatz:
http://www.w3.org/TR/html401/charset.html#h-5.1
Danke, ich habe das jetzt noch mal zum Anlaß genommen, dieses Kapitel Satz für Satz durchzuarbeiten. Solche Kapitel können nur entstehen, wenn 30 Leute zugleich daran schreiben. Verständlich ist was anderes. Ich schreib mir jetzt hier mal, wie ich das verstehe, damit ich es bei Zeiten wiederfinde :-)
5.1 (Zeichensatz des Dokumentes) beschäftigt sich mit der Frage, welche abstrakten Zeichen Teile eines HTML-Dokumentes sein können. Da steht, dass der Zeichensatz des Dokuments an sich UCS - und damit UNICODE - ist. Es geht also um die Kodierung der einzelnen Buchstaben oder Zeichen - oder wie man das jetzt genau übersetzt - des HMTL-Dokumentes. Die Darstellung des Ergebnisses im Browsers ist nicht das Thema.
Numerische Zeichenreferenzen:
http://www.w3.org/TR/html401/charset.html#h-5.3.1
Man macht aus der Not eine Tugend: Aus der Sicht des Verfassers eines Dokumentes wird auf das Problem eingegangen, wenn sich mit einen gegebenen Zeichensatz nicht alles Gewollte darstellen läßt. Bei solchen Kodierungen, wenn etwa die Hard- oder Softwareausstattung die direkte Eingabe(!) der Zeichen nicht ermöglichst, kann der Verfasser SGML-Zeichenreferenzen nutzen. Logisch, hat aber immer noch nichts mit der Darstellung der Seite im Browser zu tun.
Warum dann zum Schluß unter 5.4 dennoch auf die Darstellungproblem eingengangen wird, bleibt wohl ein Geheimnis der Autoren.
Viele Grüße
Swen Wacker