Hi,
ein PHP script liest eine CSV Datei ein die in Ascii ist und auch Umlaute enthalten kann.
das ist ein Widerspruch; ASCII enthält keine Umlaute.
Umlaute in der CSV werden daher so angezeigt:
�berregional
Das scheint dann wohl eher irgendeine 1-Byte-ISO-Codierung zu sein, etwa ISO-8859-x, vielleicht auch Windows-1252 oder sowas.
Ich wollte nun mit "mb_detect_encoding" herausfinden wie die Kodierung des Strings ist.
Das ist nicht wirklich zuverlässig möglich.
Wenn String = "gelb"
der Test gelb hat charset UTF-8
Dieser Beispieltext enthält nur ASCII-Zeichen. ASCII ist aber sowohl eine Untermenge von UTF-8 als auch ISO-8859-1, also wären alle drei Angaben richtig, weil nicht unterscheidbar.
Bei "grün"
der Test gr�n hat charset ISO-8859-1
Basierend auf Mutmaßung, ja.
Ich hatte das gerade anders herum erwartet.
Warum?
Ciao,
Martin
Du kannst dem Leben nicht mehr Tage geben.
Aber dem Tag mehr Leben.
Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(