Sebastian Becker: Problem mit Russisch und Unicode

Hallo,

ich erstelle eine mehrsprachige Webseite Deutsch/Englisch/Russisch.

Die Texte sind als Variablen in einer PHP-include-Datei (eine für jede Sprache) abgelegt - das funktioniert mit deutsch und englisch sehr gut.

Die russischen Texte habe ich als Unicode erhalten. Sobald ich aber versuche, eine unicodefähige include-Datei einzubinden (was für den russischen Text ja wohl erforderlich ist), wird diese nicht mehr von PHP geparst, sondern im Klartext angezeigt.

Das Problem hängt also irgendwie mit der Art der Textdatei zusammen, wobei mir nicht klar ist, wie man überhaupt deren Format einstellen kann. Interessant ist auch, daß, wenn ich den Unicode-Text kopiere und in eine neue Datei einfüge, nur noch Fragezeichen angezeigt werden ...

Weiß jemand Rat?
Danke, Grüße,

Sebastian Becker

  1. Hallo,

    Dein Schreibprogramm muss Unicode unterstützen. Das ist oftmals nicht der Fall. Vielleicht solltest Du lieber auf eine andere Kodierung, etwa KOI8-R ausweichen, die für russische Schriftzeichen im Web üblicher ist.

    Heiner

    1. Hallo, Heiner,

      Dein Schreibprogramm muss Unicode unterstützen. Das ist oftmals nicht der Fall. Vielleicht solltest Du lieber auf eine andere Kodierung, etwa KOI8-R ausweichen, die für russische Schriftzeichen im Web üblicher ist.

      Mein Schreibprogramm unterstützt Unicode, und nachdem der Text in Unicode vorliegt, will ich ihn auch so verwenden - was prinzipiell möglich ist.

      Möglicherweise wird die Datei beim Upload vom FTP-Programm im ASCII-Mode beschädigt?!

      Grüße,

      Sebastian

      1. Möglicherweise wird die Datei beim Upload vom FTP-Programm im ASCII-Mode beschädigt?!

        Ich kann da nur spekulieren, aber für möglich halte ich das. So wie auch Schreibprogramme Unicode-Dateien beschädigen, wenn man sie editiert, wenn die Programme kein Unicode unterstützten, so sollte das auch beim FTP-Programm möglich sein. Hast Du sie mal versuch als Binärdatei zu übertragen?

        Heiner

      2. Moin!

        Mein Schreibprogramm unterstützt Unicode, und nachdem der Text in Unicode vorliegt, will ich ihn auch so verwenden - was prinzipiell möglich ist.

        Möglicherweise wird die Datei beim Upload vom FTP-Programm im ASCII-Mode beschädigt?!

        In welcher Codierung wird die Datei denn gespeichert und übertragen? UTF-8? Das sollte jedenfalls grundsätzlich kein Problem darstellen. Allerdings wäre ich in der Tat mit dem ASCII-Modus vorsichtig, obwohl dieser lediglich die Zeilenende-Kennzeichen konvertiert, sofern es nötig ist.

        - Sven Rautenberg

        --
        ss:) zu:) ls:[ fo:} de:] va:) ch:] sh:) n4:# rl:| br:< js:| ie:( fl:( mo:|