@@frankx:
ä ist 0xE4, also 11100100 (???), immerhin aber das erste Bit gesetzt,
Nein. „Erstes Bit gesetzt“ bezieht sich nicht auf den Zeichencode, sondern auf die Oktetts bei Codierung in UTF-8. Und da ergibt 'ä' U+00E4 die Oktettsequenz C3 A4: 11000011 10100100. Das erste Bit ist also 1, das zweite auch, das dritte 0.
Beim Decodieren gehört also das dem Oktett C3 folgende A4 noch zum selben Zeichen.
Das mal ein entscheidender Schritt zu Verständnis: dass das Quadrat eben Platzhalter für ein nicht-darstellbares Zeichen ist.
Browserabhängig, siehe Thread Was bedeutet dieses Zeichen? �
Live long and prosper,
Gunnar
--
Erwebsregel 208: Manchmal ist das einzige, was gefährlicher als eine Frage ist, eine Antwort.
Erwebsregel 208: Manchmal ist das einzige, was gefährlicher als eine Frage ist, eine Antwort.