@@Wolfgang:
nuqneH
… sie bezog sich auf ASCII-Zeichen. Es gibt keine ASCII-Zeichen oberhalb von U+007F.
Das ist falsch.
Erzähl bitte keine Unsinn! Informiere dich!
In iso 8859-1 und folgende (iso 8859-n) sind definiert bis FF.
8 Bit eben. Davon war aber nicht die Rede, sondern von 7 Bit.
Das deutsche Ä zum Beispiel hat in iso 8859-1 den Wert C4. In Unicode hat es auch den Wert U+00C4, nur müsste man dort die Zeichenfolge C400 schreiben wenn ich das so richtig in Erinnerung habe.
Unterscheide zwischen Zeichensatz (Unicode) und Zeichencodierung (du meinst UTF-16)!
Es gibt UFT-16LE (little endian, Bsp. C4 00) und UTF-16BE (big endian, Bsp. 00 C4). Eben dazu dient ja das BOM, beides voneinander zu unterscheiden.
Qapla'
--
Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
(Mark Twain)
Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
(Mark Twain)