Hallo,
wennm man erst weiß, wo es kneift, dann findet man die Lösung überall im Internet, auch in den UCN von PHP:
http://php.net/manual/de/domdocument.loadhtml.php -> bigtree 
Es ist mir nie aufgefallen, dass die Meta-Angabe
<meta http-equiv="content-type" content="text/html; charset=utf-8">
für die DOMDocument-Klasse zum Verarbeiten von HTML in anderen Kodierungen, als ISO-8859-1 notwendig ist, weil ich die in meinen Testdokumenten drinstehen habe oder die untersuchten Fremdseiten immer in ISO-8859-1 waren.
Und um Gunnar gleich vorzugreifen: Das folgende reicht der DOMDocument-Klasse leider nicht.
Ein sauber aufgebautes HTML-5-Dokument wird also nur mit der antiquierten Meta-Angabe sauber geparst. Es ist und bleibt eben PHP   (plastered home production) :-P
<meta charset="utf-8">
Grüße
TS
 nicht angemeldet
 nicht angemeldet Auge
 Auge Der Martin
 Der Martin Gunnar Bittersmann
 Gunnar Bittersmann Camping_RIDER
 Camping_RIDER Matthias Apsel
 Matthias Apsel TS
 TS