Gunnar Bittersmann: utf-8

Beitrag lesen

@@Engelein:

UTF-8 ist nur gut.

Nein, utf-8 ist problematisch, wenn man nur dusseliges Werkzeug zur Verfügung hat, das mit Mehrbytezeichen nicht vernünftig umgehen kann. Im Web zum Beispiel PHP und Python, wo für utf-8-kodierte Daten andere Funktionen bzw. ein eigener Zeichentyp benutzt werden muss - als wenn ein Buchstabe jemals etwas anderes sein sollte als ein Buchstabe.

PHP ist wirklich dusselig. Anstatt dass diese Sprache* vernünftig wächst, wuchert sie wie ein Krebsgeschwür. Anstatt die vorhandenen Stringfunktionen UTF-8/16/32-fähig zu machen, wurden neue Funktionen eingefüht – und die alten im Sprachumfang belassen. Mit Vernunft hat das nichts zu tun.

Wer allerdings heutzutage noch UTF-8-unfähige Werkzeuge einsetzt, der ist selber schuld. Das ist wie eine Herzoperation mit einem Faustkeil durchzuführen.

Die Ursache liegt nun zweifelsohne nicht bei utf-8, und die Vorteil von utf-8 überwiegen sicherlich im Allgemeinen,

Eben. UTF-8 ist immer gut. Es sei denn, UTF-16 ist besser. Lediglich einige Werkzeuge sind schlecht.

trotzdem sollte dieser Umstand nicht blauäugig ausgeblendet werden. Es nützt alle bunte Theorie nichts, wenn die Praxis anders aussieht.

Ja. Ich überlege mir auch zweimal, ob ich Mails UTF-8-codiert versende, da etliche Nutzer ja nicht vernünftige Mailclients, sondern UTF-8-unfähige Webmail-Interfaces benutzten, also schlechte Werkzeuge.

Live long and prosper,
Gunnar

* PHP darf getrost eher als Gestammel bezeichnet werden denn als Sprache.

--
Erwebsregel 208: Manchmal ist das einzige, was gefährlicher als eine Frage ist, eine Antwort.