Helmut Weber: Probleme mit Umlauten beim auslesen von RSS-News

Beitrag lesen

Hallo Björn,

Mensch, jetzt seh' ich es erst! ich habe den ganzen Beispieltext einfach nur in meine Webseite hinein kopiert mit allen ös und äs ;)

Sonst macht es zu Testzwecken ja auch nichts aus, da ich die Seite sowieso ISO-8859-1 kodiert ausgebe.

Nachdem ich alle Umlaute und Sonderzeichen ordentlich umgewandelt habe, wird die Seite auch richtig dargestellt.

Wie kommt es eigentlich, das mein news-Dokument auf einmal UTF-8 kodiert ist? Ich exportiere mit dem XML::RSS doch nur die Text-Inhalte der heise-News in mein HTML-Dokument, und importiere nicht das gesamte XML-Format.

Die XML-Parser für Perl transkodieren alles zu UTF-8. Ggf. willst du http://perl-xml.sourceforge.net/faq/#encodings lesen.

Danke für den Link, werde mich mal genauer informieren! Aber eins ist mir trotz allem noch nicht klar:
Ich füge mit dem Modul HTML::Template Variablen in eine HTML-Vorlage ein, die ISO-8859-1 kodiert ist (über Meta-Angaben).
Über das Modul XML::RSS (basiert auf XML::Parser und expat) werden diese Variablen mit Informationen gefüllt.
Mit dem CGI-Modul gebe ich einen Standard-Header aus...

Woher bitte nimmt nun der Browser die Information, das er das übermittelte Dokument UTF-8 kodiert darstellen soll?

Gruß
Helmut Weber

--
-------------------------------------------
Mode ist eine Variable, Stil eine Konstante