Der Martin: Warum sind Umlaute in UTF-8 zwei Zeichen lang?

Beitrag lesen

Hallo,

Nach vielen Selbstversuchen komme ich zu der begründeten Vermutung, dass die Umlaute nun in UTF-8 eine Zeichenlänge von zwei Zeichen haben.
Kann das sein?

ja, das ist so definiert.
UTF-8 codiert alle Zeichen mit Codes >0x7F mit zwei oder mehr Bytes.

Könnte ich das anpassen?

Was? Das Verhalten von UTF-8? Nein.
Was man in den jeweiligen Scripts ändern müsste, um sie UTF-8-tauglich zu machen, sieht man erst, wenn man sich die mal anschaut. Ich fürchte aber, wenn es mit Dingen wie UTF-8 schon Probleme gibt, schlummern da noch ganz andere Probleme, von denen du noch gar nichts ahnst.
Wie alt ist das Script, was du da verwendest?

So long,
 Martin

--
Männer sind ungerecht: Sie sehen immer nur den Baum, den eine Frau mit dem Auto gerammt hat. Aber die vielen Bäume, die sie nicht einmal gestreift hat, sehen sie nicht.