pl: iso8859-1 -> utf-8

Beitrag lesen

hi,

Das Ganze dreht sich darum, dass mittels PHP preg_match() diverse Header von diversen Webseiten ausgelesen werden. Leider weiß man am Anfang nie, in welcher Kodierung die Seiten vorgehalten werden.

Das steht im Response-Header Content-Type.

Und dann weiß man als nächstes leider auch nicht, ob die Angaben des Servers (http-Header) zu denen des Inhaltes ("meta http-equiv" und weitere) und dann auch zur tatsächlichen Kodierung des Inhaltes passen.

Ich würde die Daten betreff Kodierung so verarbeiten und ggf. auch Speichern, wie es im gesendeten Content-Type deklariert ist. Wie ich hier schon vor ein paar Jahren mal gezeigt habe, ist es problemlos möglich, in eine Seite, die UTF-8-kodiert ausgeliefert wurde, per Ajax ISO-8859-1 kodierte Texte einzubauen. Beispiel ist der Golem-Feed auf meiner Site. MfG