Hallo,
wennm man erst weiß, wo es kneift, dann findet man die Lösung überall im Internet, auch in den UCN von PHP:
http://php.net/manual/de/domdocument.loadhtml.php -> bigtree
Es ist mir nie aufgefallen, dass die Meta-Angabe
<meta http-equiv="content-type" content="text/html; charset=utf-8">
für die DOMDocument-Klasse zum Verarbeiten von HTML in anderen Kodierungen, als ISO-8859-1 notwendig ist, weil ich die in meinen Testdokumenten drinstehen habe oder die untersuchten Fremdseiten immer in ISO-8859-1 waren.
Und um Gunnar gleich vorzugreifen: Das folgende reicht der DOMDocument-Klasse leider nicht.
Ein sauber aufgebautes HTML-5-Dokument wird also nur mit der antiquierten Meta-Angabe sauber geparst. Es ist und bleibt eben PHP (plastered home production) :-P
<meta charset="utf-8">
Grüße
TS