Der Martin: cp1252 zu UTF-8

Beitrag lesen

Hallo,

Denn wenn ich eine UTF-8 Datei einlese mit folgendem Inhalt

"ßä#eöt+3#öt3+4lrägojpjö3gmrp42°^t'*"

erscheint wieder Beides: UTF-8 kodiert ISO-8859-1 kodiert

Ein Editor sagt mir hier klar, das ist UTF-8.

da ist anscheinend eine zusätzliche Logik-Ebene.

Müsste der dann eigentlich sagen, klar, geht aber auch als ISO durch?

Ja, eigentlich schon. Die zusätzliche Logik sagt aber wahrscheinlich: Wenn's den komplizierteren Regeln für UTF-8 genügt, wird's wohl auch tatsächlich UTF-8 sein.

Weil da gibts dann Probleme, wenn ich das als ISO behandeln würde.

Beim Bearbeiten auf jeden Fall.

Ciao,
 Martin

--
Ach, macht ihr da Ohm doch Watt ihr Volt.