Falsche Zeichencodierung
Jörg Frintrop
- php
Hallo!
Ich habe dieser Tage im Internet und hier auf den Seiten nach meinem
Problem recherchiert und konnte dbzgl. nichts finden.
Ich bin im Besitz eines Countersystems, bei dem ich im Bezug auf
Keyword Auswertung von Suchmaschinen Probleme habe, da diese
teilweise (leider zu oft) in einem Format vorliegen wie Im Beispiel
köln
füsse
münster
etc
Wie es dazu kommt, kann ich nicht nachvollziehen, da die Schreibweise
auch teilweise korrekt vorliegt.
Mein Problem ist jetzt in PHP, dies korrekt am Bildschirm wieder auszugeben, so daß aus köln dann köln wird.
Kann mir dbzgl. jemand helfen ?
Gruss jörg
Halihallo Jörg
Wie es dazu kommt, kann ich nicht nachvollziehen, da die Schreibweise
auch teilweise korrekt vorliegt.
Verwendete Zeichenkodierung/-tabelle.
Mein Problem ist jetzt in PHP, dies korrekt am Bildschirm wieder auszugeben, so daß aus köln dann köln wird.
http://www.php.net/utf8_decode?
Viele Grüsse
Philipp
Super!
Und ich habe mich totgesucht :-((
Danke für den Hinweis.
Es hat geklappt.
Gruss Jörg
Moin!
Mein Problem ist jetzt in PHP, dies korrekt am Bildschirm wieder auszugeben, so daß aus köln dann köln wird.
Diese Aufgabe ist mit dieser Funktion nicht wirklich lösbar. Grund ist die Unentscheidbarkeit, welche Zeichencodierung denn tatsächlich vorliegt.
Der überwiegende Teil (ob es wirklich _alle_ sind, habe ich nicht geprüft) der Zeichencodierungen von UTF-8 sind nämlich auch gültige Zeichencodierungen in fast allen anderen Codierungsschemata. Das zeigt sich ja schon daran, dass die scheinbar "fehlerhaften" Worte ja darstellbar sind:
köln = k - Atilde - PI - l - n
Nur würde man natürlich vermuten, dass "köln" gemeint war - ein Computer kann aber nicht vermuten, er kann nur wissen oder nicht wissen. Und wenn keine Zeichencodierung angegeben ist, kann man eben nicht entscheiden, was benutzt wurde, wenn keine eindeutigen Hinweise existieren (z.B. durch Zeichen, die nur in einer von zwei möglichen Zeichencodierungen vorkommen).
- Sven Rautenberg