Hi,
Im Übrigen ist es auch so, dass bei neueren (X)HTML-Versionen mit der Übermittlung einer Kodierung auch stets eine Einschränkung des Zeichenvorrates stattfindet. Denn wenn man einen "Content-Type text/html" und eine Kodierung sendet, anweist, oder angibt, dann ist ein Zeichen außerhalb dieser Kodierung stets nicht definiert und damit formell ungültig. Also ist der Zeichenvorrat bei einem solchen HTML-Dokument auch dann nicht "Unicode" sondern entspricht dem Vorrat an Zeichen, der durch die Kodierung ohne Entitie-Krücken darstellbar ist.
Um noch zu verdeutlichen, dass du mit dieser Interpretation falsch liegst - darauf geht 5.3 Character references explizit ein:
“A given character encoding may not be able to express all characters of the document character set. For such encodings [...] authors may use SGML character references. Character references are a character encoding-independent mechanism for entering any character from the document character set.”
MfG ChrisB
RGB is totally confusing - I mean, at least #C0FFEE should be brown, right?