Der Martin: ungültige Zeichen in XML - Identifizierung

Beitrag lesen

Hallo,

Soweit ich das bisher herausfinden konnte enthält die XML-Datei ungültige Zeichen.

was für eine Zeichencodierung verwendest du denn? Default ist UTF-8, und da deutet "ungültiges Zeichen" eher darauf hin, dass die Datei eben *nicht* UTF-8-codiert ist, der Parser das aber erwartet.

<marker name="Vitalia Reformhaus - Ottobrunn" strasse="Roseggerstra&#223;e" hausnr="57" link="&lt;a href=&quo...
="t"> lat="52.3557612" lng="9.6718253" type="lad" />

An den deutschen Umlauten kann es schon mal nicht liegen, die sind ja richtig kodiert.

Genau - warum sind die überhaupt codiert, anstatt sie im Klartext zu notieren (richtige Zeichencodierung vorausgesetzt). In UTF-8 darfst du sie gern direkt notieren, in ISO-8859-x oder gar Windows-1252 aber auch.

Gibt es eine Möglichkeit, genau die Stelle, bzw. das genaue fehlerhafte Zeichen zu identifizieren?

Oder hast du vielleicht eine Entity-Referenz drin, die in XML nicht definiert ist? - Bedenke: XML kennt nur einen Bruchteil der Entities, die in HTML definiert sind!

So long,
 Martin

--
Wer im Glashaus sitzt, sollte sich nur im Dunkeln ausziehen.