Sven Rautenberg: größe eines string in byte

Beitrag lesen

Moin!

Komisch. Bei mir wurde aus dem "großen A-Tilde" ein "kleines A-Tilde" - und das hat natürlich alle Umlaute zerstört, die in UTF-8 immer mit dem großen A-Tilde beginnen.

Das klingt, als würdest du die UTF-8-Bytesequencen als ASCII anzeigen lassen. Hierbei ist das Resultat natürlich nicht abzuschätzen.

Ist doch klar. PHP kennt nur "ASCII". Und strtolower() bearbeitet auf Basis von ISO-8859-1.

Die einzelnen Bytes eines UTF-8-Zeichens werden also unabhängig voneinander "verkleinert".

Sowohl auf der Kommandozeile als auch in einem Script bleiben bei mir die Zeichen unangetastet. (Also auch „Æ“ beispielsweise bleibt unverändert an statt zu „æ“ zu werden.)

Nein, diesen Effekt würde ich auch nicht erwarten. Stattdessen sollte eher sowas wie "?" erscheinen, oder sonst ein Zeichenfragment.

- Sven Rautenberg

--
"Love your nation - respect the others."