TS: iso8859-1 -> utf-8

Beitrag lesen

Hallo und guten Abend,

im Wiki: Latin1-ergänzung

sonstwo: UTF-8-Codetabelle mit Unicode-Zeichen

Oh, vielen vielen Dank Massa.

keine Ursache Memsahib! (hoffentlich waren es die richtigen Tabellen?)

Das ging zumindest schon mal in die richtige Richtung

Das Ganze dreht sich darum, dass mittels PHP preg_match() diverse Header von diversen Webseiten ausgelesen werden. Leider weiß man am Anfang nie, in welcher Kodierung die Seiten vorgehalten werden. Und dann weiß man als nächstes leider auch nicht, ob die Angaben des Servers (http-Header) zu denen des Inhaltes ("meta http-equiv" und weitere) und dann auch zur tatsächlichen Kodierung des Inhaltes passen.

Meistens tauchen da auch noch HTML-Entities auf.

In der Datenbank sollen nachher aber nur gültige Werte in utf8 kodiert stehen. ächz

Liebe Grüße vom Berg
TS

--
es wachse der Freifunk
http://freifunk-oberharz.de