Hello,
Es ist kein Geheimnis, und auch nicht zum ersten Mal hier erwähnt worden, dass PHP immer noch von der Annahme 1 Zeichen = 1 Byte ausgeht. Änderungen sind erst mit der nächsten Major-Version angekündigt.
Ich frage mich sowieso immer, worin das Geheimnis des Zusammenwachsens der Welt liegt. Wenn man sich auf 127 Zeichen für die schriftliche Darstellung beschränken würde, oder wenn man den Zeichenvorrat aufbläst bis zum Sankt Nimmerleinstag.
Ich bin immer noch der Meinung, dass UTF-8 der falsche Weg ist. Hier ist der Liberalismus übertreiebn und fehl am Platze. OK, wir Deutschen müssten nur auf vier sieben Zeichen verzichten ä, ö, ü, Ä, Ö, Ü und ß. Das würden wir relativ schnell und wenig sinnverfelschend (sic!) hinbekommen.
Bei den Verwendern anderer Schriftzeichen hat sich ohnehin meistens schon eine Parallelerziehung durchgesetzt. Sie lernen also schon seit ca. 20-30 Jahren auch die lateinische Schreibweise, zumindest, wenn sie Englisch oder Französisch lernen.
In China setzt sich das auch langsam durch und junge Chinesen schreiben teilweise lieber in lateinischer Schrift, als in eigenen Schriftzeichen.
Warum sollen wir nun also alle Millionen anderer Schriftzeichen lernen und dann auch noch die recht komplizierte Darstellung auf Byteebene verstehen und umsetzen lernen (in beiden Richtungen). Das ist Babylon!
In der Reduzierung liegt hier der mMn bessere Weg.
Liebe Grüße aus dem schönen Oberharz
Tom vom Berg