Hellihello Manuela,
Saxon ist der Parser, der hier als der BEste empfohlen wird.
Wikipedia meint:
"Saxon ist ein XSL- und XQuery-Prozessor zur Transformation von XML-Dokumenten geschrieben von Michael Kay. Das Programm ist in Java und .NET geschrieben und gilt als sehr schnell. Die aktuelle Version 8.9.0.4 unterstützt XSLT 2.0, XQuery 1.0 und die Empfehlungen für XPath 2.0 vom Januar 2007.
Das Programm gibt es als kommerzielle Variante Saxon-SA und als Open-Source-Version Saxon-B. Saxon-SA ist im Unterschied zu Saxon-B in der Lage "schema-aware" zu parsen, also eine Integrität der erzeugten Daten zur Laufzeit sicherzustellen."
Hast Du denn jemals die XML-Funktionen von PHP probiert?
"SimpleXML (PHP): Die Lightweight-Lösung für PHP, um XML Dokumente einzulesen. Sie ist hoch speichereffizient (besonders im Vergleich zu DOM) und gleichzeitig einfach zu programmieren." (Wikipedia)
Wie gesagt, außer den beiden erwähnten Sonderzeichen, sollte es keine geben.
http://www.w3schools.com/xml/xml_cdata.asp
"There are 5 predefined entity references in XML:
< < less than
> > greater than
& & ampersand
' ' apostrophe
" " quotation mark
Note: Only the characters "<" and "&" are strictly illegal in XML. Apostrophes, quotation marks and greater than signs are legal, but it is a good habit to replace them."
Das Encoding ist im Kopf der XML-Datei angegeben, wenn nicht, wird utf-8 angenommen. s.a. http://www.w3schools.com/xml/xml_encoding.asp
Dank und Gruß,
frankx