Aloha ;)
Wenn ich anschließend den Inhalt von $node2->nodeValue mit var_dump ausgebe, kommt schon Umlaut-Müll heraus.
Klar. Weil deine Header-Daten sagen "ich bin UTF-8" und die Daten unter http://www.sr....html offensichtlich nicht UTF-8 sind.
Was dedlfix dir sagen wollte ist, dass du irgendwo in deinem Skript zwischen dem Einlesen der Daten (was du aktuell mit file_get_contents tust) und der Ausgabe eine (korrekte) Konvertierung vornehmen musst. Dazu brauchst du zwei Informationen: das Eingabeformat (das musst du rausbekommen) und das Ausgabeformat (hier UTF-8).
Das Eingabeformat findest du, wie dedlfix sagte, im http-Header (dazu musst du die Inhalte allerdings anders anfordern, file_get_contents ist da ungenügend, da dass nur die Antwort, nicht aber den Antwort-Header liefert) falls du es automatisch auslesen lassen willst (was sicher die nachhaltig gesehen bessere Variante ist), oder du bestimmst es einmal zu Fuß und kodierst es dann hart.
@Edit: Du könntest die Inhalte beispielsweise über http_get anfordern oder die Klassen HttpRequest/HttpMessage nutzen.
Grüße,
RIDER
Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller Erreichbar manchmal im Self-TS (ts.selfhtml.org) oder sonst - wenn online - auf dem eigenen TeamSpeak-Server (fritz.campingrider.de) oder unter: # Facebook # Twitter # Steam # YouTube # Self-Wiki # ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[