Hallo und guten Abend,
im Wiki: Latin1-ergänzung
sonstwo: UTF-8-Codetabelle mit Unicode-Zeichen
Oh, vielen vielen Dank Massa.
keine Ursache Memsahib! (hoffentlich waren es die richtigen Tabellen?)
Das ging zumindest schon mal in die richtige Richtung
Das Ganze dreht sich darum, dass mittels PHP preg_match() diverse Header von diversen Webseiten ausgelesen werden. Leider weiß man am Anfang nie, in welcher Kodierung die Seiten vorgehalten werden. Und dann weiß man als nächstes leider auch nicht, ob die Angaben des Servers (http-Header) zu denen des Inhaltes ("meta http-equiv" und weitere) und dann auch zur tatsächlichen Kodierung des Inhaltes passen.
Meistens tauchen da auch noch HTML-Entities auf.
In der Datenbank sollen nachher aber nur gültige Werte in utf8 kodiert stehen. ächz
Liebe Grüße vom Berg
TS