Tim: UTF-8 ISO MIX Wie erkennen und anpassen

Beitrag lesen

Hi Tom,

Was muss ich tun?

Das Archiv durchsuchen.

Na ja sofern meine These richtig ist, aber meine erste Frage war ja ob das nicht einfacher gehen kann.

Aufgabe war damals: UTF-8 automatisch erkennen und die Lauflänge (Anzahl fer Bytes) des jeweiligen Zeichens bestimmen.

Danke, meinst du das?
http://forum.de.selfhtml.org/archiv/2008/9/t176846/#m1164170

Ja, jetzt wird es kurios.

Zunächst habe ich, wie du auch, mb_detect_encoding() probiert.
Dann bekomme ich bei 3 verschiedenen Inhalten als Rückgabe UTF-8, kann aber nicht denn je nach Einstellung der Browsercodierung oder wahlweise der HTML Bestimmung, erhalte ich bei 2en lesbares und beim dritten Hieroglyphen, oder eben umgekehrt.

Nun habe ich die Funktion valid_utf8() probiert, da bekomme ich dann tatsächlich 2 = false, 1= utf-8 "3". Wobei ich nicht ganz verstehe was mit den leveln 1-4 gemeint ist.

So nun zurück zu meinem Problem. Bedeutet das nun wenn es kein UTF-8 ist ist es automatisch iso bzw. kann ich falls FALSE unbesorgt utf8_encode anwenden?

Gruss
Tim