Moin!
ich habe eine geexportierte database als .txt und muss diese umwandeln in xml. Das Problem ist, wenn ich utf8_encode(); nutze werden bestimmte Zeichen gelöscht:
Das Problem ist, dass du eine unbekannte Zeichencodierung nicht umwandeln kannst, weil dir schlicht die Kodierungsvorschrift für "Welches Byte steht für welches Zeichen" fehlt.
Finde heraus, welche Codierung verwendet wird - erst dann kannst du sinnvoll umwandeln. Und dann sinnvollerweise lieber mit iconv.
"`"
"´"
"€"Wenn ich die txt unter windows öffne ist alles ok. Unter vim sehe ich <92> <91> <80> unter joe sind es wieder andere Zeichen. Mit einem simpelem str_replace wäre ich schon zufrieden aber wonach suchen?
Sieht nach Windows-1252 aus, zumindest was die Position des Eurozeichens angeht. Ist aber inkompatibel zu ISO-8859-1, welches von utf8_encode() benutzt wird. Deshalb verschwinden die Zeichen.
- Sven Rautenberg
"Love your nation - respect the others."