Moin!
Ich nehme an, komplett auf UTF-8 zu bauen, ist keine Option für dich?
Das würde ich gerne tun, nur weiß ich nicht wie. Bei htmlentities() gebe ich UTF-8 bereits an - was kann ich noch tun?
Weniger.
UTF-8 zwingt dich ja nicht, numerische Zeichenreferenzen einzubauen. Das ist ja doch gerade der Witz an der Sache, dass man wirklich alle Unicode-Zeichen direkt als Bytekombination im String stehen hat.
Dein XML-Parser wandelt numerische Zeichenreferenzen in UTF-8-Zeichen um. Und gut ist. Diese Zeichen bzw. ihre Bytes kannst du direkt so lassen.
Auch bei der erneuten Ausgabe als XHTML, XML oder HTML - oder sonstwas. Solange du angibst, dass du UTF-8 codierst, sollte die Gegenseite damit kein Problem haben. Sie hätte es ansonsten auch mit den numerischen Zeichenreferenzen.
- Sven Rautenberg
"Love your nation - respect the others."