Hallo Harlequin,
Als Ergänzung:
[UTF-16] Bei den Zeichen die auch in ASCII vorkommen ist dabei das höherwertige Byte immer 0 (Bei Sonderzeichen kann da dann schon mal etwas anderes stehen). Deshalb gibt es auch die UTF-8 Kodierung, die solche Zeichen nur mit einem Byte darstellt, aber trotzdem alle Unicode-Zeichen darstellen kann
... wobei UTF-8 für Nicht-ASCII-Zeichen mindestens 2 Bytes benötigt, manchmal noch mehr und nur ASCII-Zeichen mit 1 Byte auskommen (nur als Klarstellung).
(etwas das UTF16 glaub ich nicht kann, da es inzwischen über 65536 Zeichen in Unicode gibt).
Nein, UTF-16 kann den gesamten Unicode-Bereich abdecken. Zeichen, die nicht mehr zum BMP gehören werden (die BMP ist etwas weniger als die vollen 16bit groß) in UTF-16 durch 2 sogenannte "Surrogates" dargestellt, d.h. durch zwei Hilfszeichen hintereinander. Damit ist UTF-16 keine 16-bit-Kodierung im Sinne "jedes Zeichen ist 16 bit lang", sondern nur eine 16-bit-Kodierung im Sinne "die Basiseinheit der Kodierung ist 16 bit, alle Zeichen werden als ganzzahlige Vielfache davon dargestellt". In UTF-16 können Zeichen entweder 2 oder 4 Oktetts groß sein.
Viele Grüße,
Christian