Gunnar Bittersmann: Warum sind Umlaute in UTF-8 zwei Zeichen lang?

Beitrag lesen

@@philosapiens:

nuqneH

Nach vielen Selbstversuchen komme ich zu der begründeten Vermutung, dass die Umlaute nun in UTF-8 eine Zeichenlänge von zwei Zeichen haben.

Kann das sein?

Nein, Umlaute haben wie alle anderen Zeichen die Zeichenlänge von einem Zeichen.

Zeichen werden in UTF-8 aber durch unterschiedlich viele Oktetts (Bytes) codiert. Die Basic-Latin-Zeichen (ASCII-Zeichen) durch ein Byte, deutsche Umlaute durch 2 Bytes, das Euro-Zeichen durch 3 Bytes.

Qapla'

--
Alle Menschen sind klug. Die einen vorher, die anderen nachher. (John Steinbeck)