pasti: UTF-8 Konvertierung, Probleme mit Hochkommas

Hallo!

Ich bekomme Text in OTF-8-Kodierung geliefert. Mit iconv möchte ich den umwandeln in 8859-1.

Das klappt soweit auch ganz gut, z.B. mit Umlauten.

Wo ich extreme Probleme habe, sind die Hochkommas, die so unten und oben sind.
Hier ein Bespieltext: Das ist aber „schön“ anzusehen.

iconv() bricht an der Stelle des ersten Hochkommas ab und liefert nur den Text bis zu diesem Hochkomma zurück, nämlich "Das ist aber".
Alles was danach kommt, verschwindet.

Auch eine Vorab-Stringersetzung funktionierte nicht.

Diese habe ich mit
str_replace(chr(132),"'",$string) und
str_replace(chr(147),"'",$string)
probiert, ohne Ergebnis, heisst, mit diesen Ascii-Codes werden die Zeichen anscheinend im $string nicht gefunden.

Wie kann ich das Problem lösen?

Vielen Dank,
Pasti

  1. hi,

    Hier ein Bespieltext: Das ist aber „schön“ anzusehen.

    iconv() bricht an der Stelle des ersten Hochkommas ab und liefert nur den
    Wie kann ich das Problem lösen?

    Gar nicht. Diese Art von Hochkomma's gibts nicht in ISO (den € auch nicht).

    Hotti

    1. Gar nicht. Diese Art von Hochkomma's gibts nicht in ISO (den € auch nicht).

      Hm, aber warum kann man das nicht mit str_replace ersetzen lassen? Das müsste doch gehen?

      Oder auch nicht?

      Also selbst, wenn es kein darstellbares Zeichen in 8859-1 gibt, so müsste ich doch den Ascii-Code dann ersetzen lassen können?!

      Danke, Pasti

      1. Hi,

        Also selbst, wenn es kein darstellbares Zeichen in 8859-1 gibt, so müsste ich doch den Ascii-Code dann ersetzen lassen können?!

        Welchen ASCII-Code?

        MfG ChrisB

        --
        “Whoever best describes the problem is the person most likely to solve the problem.” [Dan Roam]
  2. Hi!

    Ich bekomme Text in OTF-8-Kodierung geliefert. Mit iconv möchte ich den umwandeln in 8859-1.
    Wo ich extreme Probleme habe, sind die Hochkommas, die so unten und oben sind.
    Wie kann ich das Problem lösen?

    Wie bereits gesagt, diese Zeichen gibt es in ISO-8859-1 nicht. Allerdings gibt es Windows-1252, was alle darstellbaren ISO-8859-1-Zeichen enthält und im Bereich 80-9F noch ein paar mehr. Die meisten Browser dekodieren als ISO-8859-1 deklarierte Texte nach Win-1252, wenn Zeichen aus diesem Bereich enthalten sind. Besser wäre es aber, wenn du dann solche Texte als Windows-1252 kennzeichnest.

    Lo!

    1. Hallo

      Ich bekomme Text in OTF-8-Kodierung geliefert. Mit iconv möchte ich den umwandeln in 8859-1.
      Wo ich extreme Probleme habe, sind die Hochkommas, die so unten und oben sind.
      Wie kann ich das Problem lösen?

      Wie bereits gesagt, diese Zeichen gibt es in ISO-8859-1 nicht. Allerdings gibt es Windows-1252, was alle darstellbaren ISO-8859-1-Zeichen enthält und im Bereich 80-9F noch ein paar mehr. Die meisten Browser dekodieren als ISO-8859-1 deklarierte Texte nach Win-1252, wenn Zeichen aus diesem Bereich enthalten sind. Besser wäre es aber, wenn du dann solche Texte als Windows-1252 kennzeichnest.

      Vielleicht sollte erst mal geklärt werden, warum überhaupt umkodiert werden soll. Es könnte ja durchaus sein, dass pasti sich das sparen kann.

      Tschö, Auge

      --
      Verschiedene Glocken läuteten in der Stadt, und jede von ihnen vertrat eine ganz persönliche Meinung darüber, wann es Mitternacht war.
      Terry Pratchett, "Wachen! Wachen!"
      Veranstaltungsdatenbank Vdb 0.3