Christian Kruse: XML::DOM::Parser hat Probleme mit Umlauten

Beitrag lesen

你好 Marion,

Ich verstehe bloß nicht, dass es nun statt z.B. Bücher folgendermaßen
dargestellt wird:  Bücher

XML-Parser arbeiten intern fast alle mit UTF-8. D.h. die XML-Datei wird
eingelesen und dabei (oder danach oder währenddessen) werden die Text-Daten
umgewandelt nach UTF-8. Das wird gemacht, um einen einheitlichen Charset
aus Programmierer-Sicht zu haben. XML-Dateien erlauben ja, dass man nahezu
beliebige Charsets benutzt (auch wenn ein XML-Parser nur UTF-8 und UTF-16
implementieren muss). Wenn der XML-Parser diese Umformung nicht machen
würde, müsste der Anwendungsentwickler sich mit zig unterschiedlichen
Encodings rumnerven…

Kurz gesagt: XML::DOM wandelt zu deiner Entlastung den Input um in UTF-8.

再见,
 克里斯蒂安