Wolfgang: Probleme mit Umlauten

Beitrag lesen

Normalerweise sollte \xE4 das "ä" in ISO-Kodierung sein.

Wenn ein ISO-codiertes ä in einem utf-8-Text auftaucht dann ist das ein Zeichen mit einer 1 im führendem Bit. Innerhalb des utf-8 wird dann auf das nächste Byte zugegriffen und beide Bytes dann als ein Zeichen dargestellt, was m.E. beliebige Werte annehmen kann. Von daher kann man m.E. nur

a) zurückschalten nach ISO
b) ä austauschen gegen ae
c) wieder schalten nach utf-8
d) ae austauschen gegen ä