dedlfix: Warum sind Umlaute in UTF-8 zwei Zeichen lang?

Beitrag lesen

Hi!

also via php liefere ich mit den header-Angaben auch gleich mb_internal_encoding('utf-8'); aus.

Das hat nichts mit ausliefern zu tun, das ist eine Information an die mb-Extension, dass sie mit UTF-8 zu arbeiten hat. Sie kann das nämlich auch noch mit einer Reihe weiterer Kodierungen. Und wenn man ihr nicht sagt, was sie nehmen soll, macht sie prinzipbedingt Mist. Kodierungen lassen sich programmatisch nicht zweifelsfrei erraten.

Also Du meinst, das es zumindest gehen könnte?

Zu den Erfolgschancen meine ich gar nichts. Ich weise dich nur auf das hin, worauf du achten musst (soweit es mir bekannt ist und gerade einfällt), wenn du dich an die Umgestaltung machst.

Ich meine, dass durch eine solche "Anpassung" die Zeichenlänge bzw. Byte-Anzahl zum farbigen Markieren nicht mehr zu stören könnte?

Stören ist das falsche Wort. Die beteiligten Komponenten müssen mit der zu verarbeitenden Kodierung umgehen können. Genauso, wie ihnen bisher beigebracht wurde, mit ISO-8859-1 umgehen zu können, muss ihnen beigebracht werden, mit UTF-8 umgehen zu können.

Lo!