Claus: htmldoc setzt kyrillische Zeichen falsch um

Beitrag lesen

Hallo Martin,

Da hast du ja Glück gehabt, dass dein Server im HTTP-Header keine Angabe zur Zeichencodierung mitsendet, sonst wäre die meta-Angabe völlig bedeutungslos.
Aber was immer du gemacht hast - die UTF-8-BOM im geänderten Dokument deutet zwar auf eine UTF-8-Codierung hin, die Fehler/Ersatzzeichen U+FFFD in der Nähe des Wortes "Remoulade" ebenfalls. Aber die unsäglichen numerischen Zeichenreferenzen sind immer noch drin.

»»

Also was habe ich dann bei der Umsetzung (Setzen und Abspeichern als UTF-8) falsch gemacht bzw. unterlassen?

und das ist der PDF-Output http://pdf.baseportal.de/?url=http://www.badener-weinkeller.de/baseportal/speisen2%26cmd%3ddo_pdf%26language%3dRU&bodycolor=ffffff&footer=d/T

Sieht aus, als hätte dein PDF-Generator nicht die leiseste Ahnung davon, dass es sich beim Quellmaterial um UTF-8 handelt, und versucht alle Bytes als einzelne Zeichen zu interpretieren. Immerhin löst er wenigstens die numerischen Zeichenreferenzen auf, das scheint also nicht das Problem zu sein. Man müsste ihm nur "irgendwie" mitteilen, dass es UTF-8 ist.

Was den PDF-Generator angeht, wenn ich mich mal direkt an den Hersteller

So long,
Martin

Danke und Gruss

Claus

0 46

htmldoc setzt kyrillische Zeichen falsch um

Claus
  • software
  1. 0
    Jens Holzkämper
    1. 0
      Claus
      1. 0
        Jens Holzkämper
        1. 0
          Claus
          1. 0
            Gunnar Bittersmann
            1. 0
              Claus
              1. 0
                dedlfix
          2. 0
            Der Martin
            1. 0
              Claus
              1. 0
                Jens Holzkämper
              2. 0
                Wolfgang
                1. 0
                  Gunnar Bittersmann
                  1. 0
                    Beat
                    1. 0
                      Der Martin
                    2. 0
                      Gunnar Bittersmann
                      1. 0

                        Vornamen

                        Der Martin
                        • sonstiges
                      2. 0
                        Beat
                        1. 0
                          Gunnar Bittersmann
                          1. 0
                            cygnus
                      3. 0
                        dedlfix
                        1. 0
                          Gunnar Bittersmann
                    3. 0
                      Wolfgang
                      1. 0
                        Beat (der andere)
                        1. 0
                          Der Martin
                          1. 0
                            cygnus
                            • menschelei
                        2. 0
                          Gunnar Bittersmann
                          • meinung
                      2. 0
                        dedlfix
                  2. 0
                    Wolfgang
                    1. 1
                      Gunnar Bittersmann
                      1. 0
                        Wolfgang
                        1. 0
                          Gunnar Bittersmann
                          1. 0
                            Wolfgang
                            1. 0
                              Gunnar Bittersmann
                            2. 0
                              Peter Pan
                        2. 0
                          Der Martin
                          1. 0
                            Wolfgang
                            1. 0
                              Jens Holzkämper
                            2. 0
                              dedlfix
                2. 0
                  Vinzenz Mai
  2. 0
    Felix Riesterer
    1. 0
      Gunnar Bittersmann
      1. 0
        Claus
        1. 0
          Gunnar Bittersmann
    2. 0
      Claus
      1. 0
        Alex