Axel Richter: Einlesen von xml-Dokument ergibt fehlerhafte Zeichen

Beitrag lesen

Hallo,

hab grad nochmal nachgeschaut, die RSS-Datei ist in ISO-8859-1 (also Standardzeichensatz) kodiert.

Warum willst Du diese Kodierung nicht beibehalten? Du kannst nicht einfach die Kodierung in UTF-8 ändern und erwarten, dass z.B. ü (\xFC) dann immer noch als ü angezeigt wird. In UTF-8 wird ü angezeigt, wenn in den Byte-Daten \xC3BC steht.

Du könntest mit http://de2.php.net/htmlentities alle Sonderzeichen in HTML-Entities umwandeln. Im Kontext text/html ist für diese Entities das eingestellte charset dann egal.

viele Grüße

Axel