Sven Rautenberg: htmlentities() verwendet nicht get_html_translation_table()

Beitrag lesen

Moin!

Ich nehme an, komplett auf UTF-8 zu bauen, ist keine Option für dich?

Das würde ich gerne tun, nur weiß ich nicht wie. Bei htmlentities() gebe ich UTF-8 bereits an - was kann ich noch tun?

Weniger.

UTF-8 zwingt dich ja nicht, numerische Zeichenreferenzen einzubauen. Das ist ja doch gerade der Witz an der Sache, dass man wirklich alle Unicode-Zeichen direkt als Bytekombination im String stehen hat.

Dein XML-Parser wandelt numerische Zeichenreferenzen in UTF-8-Zeichen um. Und gut ist. Diese Zeichen bzw. ihre Bytes kannst du direkt so lassen.

Auch bei der erneuten Ausgabe als XHTML, XML oder HTML - oder sonstwas. Solange du angibst, dass du UTF-8 codierst, sollte die Gegenseite damit kein Problem haben. Sie hätte es ansonsten auch mit den numerischen Zeichenreferenzen.

- Sven Rautenberg

--
"Love your nation - respect the others."