AllesMeins: "Geisterzeichen" finden

Hiho,

ich stehe gerade vor folgendem Problem. Ich habe hier eine XML-Datei, die von irgend einem uralten System erzeugt wurde. Die Datei soll per PHP importiert werden. Das klappt generell auch halbwegs zufriendenstellend. Doch jetzt musste ich feststellen das der PHP XML-Parser scheinbar vollkommen unsinnige Zeichenumbrüche findet. So bricht er beispielsweise in einem Fall das Wort "die" nach dem d um. Wenn ich nun die XML öffne, das Wort "die" rauslösche und per Hand wieder reinschreibe, dann ist dieser komische Zeichenumbruch verschwunden. Wenn ich die Datei aber irgendwie anders öffne/auslese dann kann ich dieses Zeilenumbruchzeichen nicht aufspüren. Hat irgendwer eine Ahnung wie ich sicher prüfen kann ob (und wenn ja welches) Zeichen da noch drinne steckt?

Grüße

Marc

  1. Hi,

    Filter! Nimm am besten einen pessimistischen Filter, der nur bestimmte Zeichen durchlässt.

    Didi

  2. Hallo AllesMeins,

    Oeffne die Datei mal in einem Hex-Editor, damit du weisst, worum es sich bei dem fraglichen Zeichen dreht. Ein beherztes str_replace() sollte dein Problem dann loesen.

    Gruß,

    Dieter