UTF-8 Konvertierung, Probleme mit Hochkommas
pasti
- php
Hallo!
Ich bekomme Text in OTF-8-Kodierung geliefert. Mit iconv möchte ich den umwandeln in 8859-1.
Das klappt soweit auch ganz gut, z.B. mit Umlauten.
Wo ich extreme Probleme habe, sind die Hochkommas, die so unten und oben sind.
Hier ein Bespieltext: Das ist aber „schön“ anzusehen.
iconv() bricht an der Stelle des ersten Hochkommas ab und liefert nur den Text bis zu diesem Hochkomma zurück, nämlich "Das ist aber".
Alles was danach kommt, verschwindet.
Auch eine Vorab-Stringersetzung funktionierte nicht.
Diese habe ich mit
str_replace(chr(132),"'",$string)
und
str_replace(chr(147),"'",$string)
probiert, ohne Ergebnis, heisst, mit diesen Ascii-Codes werden die Zeichen anscheinend im $string nicht gefunden.
Wie kann ich das Problem lösen?
Vielen Dank,
Pasti
hi,
Hier ein Bespieltext: Das ist aber „schön“ anzusehen.
iconv() bricht an der Stelle des ersten Hochkommas ab und liefert nur den
Wie kann ich das Problem lösen?
Gar nicht. Diese Art von Hochkomma's gibts nicht in ISO (den € auch nicht).
Hotti
Gar nicht. Diese Art von Hochkomma's gibts nicht in ISO (den € auch nicht).
Hm, aber warum kann man das nicht mit str_replace ersetzen lassen? Das müsste doch gehen?
Oder auch nicht?
Also selbst, wenn es kein darstellbares Zeichen in 8859-1 gibt, so müsste ich doch den Ascii-Code dann ersetzen lassen können?!
Danke, Pasti
Hi,
Also selbst, wenn es kein darstellbares Zeichen in 8859-1 gibt, so müsste ich doch den Ascii-Code dann ersetzen lassen können?!
Welchen ASCII-Code?
MfG ChrisB
Hi!
Ich bekomme Text in OTF-8-Kodierung geliefert. Mit iconv möchte ich den umwandeln in 8859-1.
Wo ich extreme Probleme habe, sind die Hochkommas, die so unten und oben sind.
Wie kann ich das Problem lösen?
Wie bereits gesagt, diese Zeichen gibt es in ISO-8859-1 nicht. Allerdings gibt es Windows-1252, was alle darstellbaren ISO-8859-1-Zeichen enthält und im Bereich 80-9F noch ein paar mehr. Die meisten Browser dekodieren als ISO-8859-1 deklarierte Texte nach Win-1252, wenn Zeichen aus diesem Bereich enthalten sind. Besser wäre es aber, wenn du dann solche Texte als Windows-1252 kennzeichnest.
Lo!
Hallo
Ich bekomme Text in OTF-8-Kodierung geliefert. Mit iconv möchte ich den umwandeln in 8859-1.
Wo ich extreme Probleme habe, sind die Hochkommas, die so unten und oben sind.
Wie kann ich das Problem lösen?Wie bereits gesagt, diese Zeichen gibt es in ISO-8859-1 nicht. Allerdings gibt es Windows-1252, was alle darstellbaren ISO-8859-1-Zeichen enthält und im Bereich 80-9F noch ein paar mehr. Die meisten Browser dekodieren als ISO-8859-1 deklarierte Texte nach Win-1252, wenn Zeichen aus diesem Bereich enthalten sind. Besser wäre es aber, wenn du dann solche Texte als Windows-1252 kennzeichnest.
Vielleicht sollte erst mal geklärt werden, warum überhaupt umkodiert werden soll. Es könnte ja durchaus sein, dass pasti sich das sparen kann.
Tschö, Auge