Sven Rautenberg: unbekannte dos codierung umwandeln mit php

Beitrag lesen

Moin!

ich habe eine geexportierte database als .txt und muss diese umwandeln in xml. Das Problem ist, wenn ich utf8_encode(); nutze werden bestimmte Zeichen gelöscht:

Das Problem ist, dass du eine unbekannte Zeichencodierung nicht umwandeln kannst, weil dir schlicht die Kodierungsvorschrift für "Welches Byte steht für welches Zeichen" fehlt.

Finde heraus, welche Codierung verwendet wird - erst dann kannst du sinnvoll umwandeln. Und dann sinnvollerweise lieber mit iconv.

"`"
"´"
"€"

Wenn ich die txt unter windows öffne ist alles ok. Unter vim sehe ich <92> <91> <80> unter joe sind es wieder andere Zeichen. Mit einem simpelem str_replace wäre ich schon zufrieden aber wonach suchen?

Sieht nach Windows-1252 aus, zumindest was die Position des Eurozeichens angeht. Ist aber inkompatibel zu ISO-8859-1, welches von utf8_encode() benutzt wird. Deshalb verschwinden die Zeichen.

- Sven Rautenberg

--
"Love your nation - respect the others."