Henry: cp1252 zu UTF-8

Beitrag lesen

Hallo dedlfix,

e ein Editor? Weil, so wie ich es probiert habe, offensichtlich nicht.

Siehe obiges Zitat. Für Ein-Byte-Kodierungen gibt es prinzipbedingt keine Indizien. Man kann lediglich den Text analysieren, ob der sinnvoll ist.

Man kann auch nicht UTF-8 und ISO-8859-1 und ASCII voneinander unterscheiden, wenn der Text lediglich ASCII-Zeichen enthält. Er ist dann zu allen drei Kodierungen kompatibel.

Jetzt bin ich wieder verwirrt.

Ich habe doch dieses Beispiel:
Denn wenn ich eine UTF-8 Datei einlese mit folgendem Inhalt

"ßä#eöt+3#öt3+4lrägojpjö3gmrp42°^t'*"

erscheint wieder Beides: UTF-8 kodiert ISO-8859-1 kodiert

Ein Editor sagt mir hier klar, das ist UTF-8. Müsste der dann eigentlich sagen, klar, geht aber auch als ISO durch? Weil da gibts dann Probleme, wenn ich das als ISO behandeln würde.

Gruss
Henry

--
Meine Meinung zu DSGVO & Co:
„Principiis obsta. Sero medicina parata, cum mala per longas convaluere moras.“