cp1252 zu UTF-8 von Henry, 11.10.2019 03:12

cp1252 zu UTF-8

Henry 11.10.2019 03:12

Hallo,

Auch ganz interessant. Ist es denn möglich solche Fälle verlässlich durch zusätzlich mb_detect_encoding() anzusichern, oder alternative Möglichkeiten?

Obwohl ich diese Funktion anscheinend nicht richtig verstehe, weil...

if(mb_detect_encoding($txt,'UTF-8')){echo 'UTF-8 kodiert';}

if(mb_detect_encoding($txt,'ISO-8859-1')){echo 'ISO-8859-1 kodiert';}

erhalte ich als Ergebnis: UTF-8 kodiert ISO-8859-1 kodiert Ja und beides kann doch nicht gleichzeitig richtig sein oder doch?

Daher habe ich mal mb_check_encoding() ausprobiert:

if(mb_check_encoding($txt,'UTF-8')){echo 'UTF-8 kodiert';}

if(mb_check_encoding($txt,'ISO-8859-1')){echo 'ISO-8859-1 kodiert';}

und ja, hier funktioniert es scheinbar. Ausgabe: ISO-8859-1 kodiert

Oder doch nicht?

Denn wenn ich eine UTF-8 Datei einlese mit folgendem Inhalt "ßä#eöt+3#öt3+4lrägojpjö3gmrp42°^t'*" erscheint wieder Beides: UTF-8 kodiert ISO-8859-1 kodiert

Alles sehr verwirrend, diese ganzen Kodierungslabyrinthe. Selbst jeder Editor erkennt eine UTF-8 Datei ohne BOM als solche an, sobald auch nur ein Umlaut drin ist. Was mache ich falsch?

Andere Frage, hat nichts damit zu tun. Backticks ` kann ich hier, wie auch in anderen Textfeldern mit Shift+AltGr+Symbol sofort erstellen. In Editoren aber nur der komplizierte Weg mit Shift+Symbol+ irgendwann Leertaste oder irgendwas. Warum nicht überall wie im Browser, bzw. wo kommt diese Sache eigentlich her, dass ein Backtick durch shift+symbol bereits unsichtbar gespeichert wird aber erst aktiviert wird durch weiteres Zeichen/Leertaste, was ist der Sinn?

Gruss
Henry

--
Meine Meinung zu DSGVO & Co:
„Principiis obsta. Sero medicina parata, cum mala per longas convaluere moras.“

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Henry: cp1252 zu UTF-8

Beitrag lesen

cp1252 zu UTF-8

CSV Adressen Import bei DHL

cp1252 zu UTF-8