Tim Tepaße: Kodierungsformat

Beitrag lesen

Hallo Christian,

Ein in UTF-8 kodiertes Zeichen kann 1 bis 6 (nicht 4! Das ist ein Fehler,
der ISO-Standard spricht eindeutig von 6) Byte belegen.

RFC 3629 beschränkt die Bytes aber nur auf vier Bytes (»Octets«), wenn ich mich recht erinnere, um dieselbe Menge an Zeichen wie UTF-16 zu erreichen. Deswegen wahrscheinlich dieses häufige Mißverständnis.

Tim