Tach!
$dom = new DOMDocument('1.0', 'utf-8'); $dom->encoding = 'utf-8'; $dom->validateOnParse = TRUE; $dom->strictErrorChecking = true ; $dom->preserveWhiteSpace = true; $dom->loadXML($page);
Damit bekomme ich nur einen Haufen XML-Parser-Fehler.
Du lädst die Seite als HTML in den Parser, sie ist aber als XML deklaiert. Das scheint der Klasse nicht zu schmecken.
Ich kann die Seite nur mit loadHTML() laden. Und da hat eine Änderung der Konstruktorparameter von DOMDocument nichts gebracht. Das Handbuch verrät in den User-Kommentaren, dass loadHTML() ISO-8859-1 erwartet. (Meine Erfahrung hatte was von UTF-8 abgespeichert, aber das war dann wohl eine andere Situation.) Ein Trick wäre wohl die Kodierung als XML-Vorspann voranzustellen.
$doc->loadHTML('<?xml encoding="UTF-8">' . $data);
Damit sah die Ausgabe gut aus. Anführungszeichen waren aber leider grad keine verfügbar.
dedlfix.