Sebastian Becker: Russisch

Hallo,

für eine zweisprachige Seite bekomme ich russische Texte als .doc (Word-Format) zugeliefert.

Wie codiere ich nun die entsprechende HTML-Seiten am besten (charset), damit diese in fast allen Browsern richtig angezeigt werden und ein evtl. Konvertierungsaufwand gering ist?

In Frage kämen insbesondere koi8-r, windows-1251, iso8859-5 und UTF-8. PHP steht zur Konvertierung (convert_cyr_string) zur Verfügung, falls erforderlich.

Danke für alle sachdienlichen Hinweise, Grüße,

Sebastian

  1. Ich würde im UTF Format kodieren, da bist du auf der sicheren Seite, auch für die Zukunft, denn sonst bekommst du Probleme mit XHTML

    Hoffe das Statement hilft dir weiter ;-)

    1. Hallo, Momo,

      Ich würde im UTF Format kodieren, da bist du auf der sicheren Seite, auch für die Zukunft, denn sonst bekommst du Probleme mit XHTML

      Hoffe das Statement hilft dir weiter ;-)

      danke, aber die Zukunftsprobleme sehe ich erst mal nicht. Wichtiger sind die Faktoren korrekte Anzeige in fast allen Browsern sowie geringer Konvertierungsaufwand. Wenn das für UTF-8 zutrifft, will ich das gerne verwenden ...

      Grüße,

      Sebastian

    2. Hallo!

      Ich würde im UTF Format kodieren, da bist du auf der sicheren Seite, auch für die Zukunft, denn sonst bekommst du Probleme mit XHTML

      Was genau hat das mit XHTML zu tun?

      emu

  2. Hallo!

    Wie codiere ich nun die entsprechende HTML-Seiten am besten (charset), damit diese in fast allen Browsern richtig angezeigt werden und ein evtl. Konvertierungsaufwand gering ist?
    In Frage kämen insbesondere koi8-r, windows-1251, iso8859-5 und UTF-8. PHP steht zur Konvertierung (convert_cyr_string) zur Verfügung, falls erforderlich.

    Ich nehme an, es ist ziemlich egal, Quasistandard ist der Windowszeichensatz, UTF-8 dürfte vielleicht für dich interessant sein, die anderen Zeichensätzen (inkl. dem alten DOS-Zeichensatz) werden kaum noch verwendet. Die meisten russischen Seiten haben anscheinend ohnehin keine Zeichensatzangabe und verlassen sich darauf, dass der Browser richtig herumraten kann.

    emu

  3. Hallo,

    für eine zweisprachige Seite bekomme ich russische Texte als .doc (Word-Format) zugeliefert.

    Gut. Wenn du in der Datei lediglich den Text stehen hast, dann kannst du bei Word mit Speichern unter eine Datei im Unicode Format erzeugen.

    Wie codiere ich nun die entsprechende HTML-Seiten am besten (charset), damit diese in fast allen Browsern richtig angezeigt werden und ein evtl. Konvertierungsaufwand gering ist?

    Aus dieser Unicode Datei solltest du dann Problemlos zu den gänigen Russischen Zeichensätzen konvertieren können. Wenn du das serverseitig machst, dann kannst du ja diverse Zeichensätze anbieten und brauchst trotzdem nur eine Datei.

    Oder du verlässt dich darauf, dass Unicode funktioniert. Mit dem aktuellen IE und Mozilla klappt es auf jeden Fall, habe es gerade getestet.

    Viele Grüße,

    Stefan

  4. Moin, moin

    habe dazu auch schon einiges probiert. Wirklich funktioniert aber nur die Einbindung als Bild. Alles andere scheitert je nach Clienteinstellung. (Spätestens beim Mac... )

    Bei einem kleinen Projekt (s.URL) habe ich das mal probiert. Funktioniert auch mit IE, Netscape, Opera und Mozilla. Bei Mac wie gesagt je nach "Tageslaune".

    ...
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    ...
    ...
    &#x041F;&#x041E;-&#x0420;&#x0423;&#x0421;&#x0421;&#x041A;&#x0418;
    ...
    ...

    Nicht wirklich lustig, zumal es nicht wirklich funktioniert ;-(

    Wenn die Seite mehrsprachig werden soll kann man sich bestimmt auch nicht auf die Rechnereinstellungen bei einem Ukrainer oder Norweger ... verlassen.

    MfG Andreas

    1. Hallo!

      Wirklich funktioniert aber nur die Einbindung als Bild.

      Das ist völlig absurd.

      Alles andere scheitert je nach Clienteinstellung. (Spätestens beim Mac... )

      Welcher (moderne, ernstzunehmende) Browser am Mac schafft es nicht, eine gängige Kodierung mit entsprechender Angabe im Quelltext sinnvoll darzustellen?

      Wenn die Seite mehrsprachig werden soll kann man sich bestimmt auch nicht auf die Rechnereinstellungen bei einem Ukrainer oder Norweger ... verlassen.

      Ich dachte, Norwegisch sei Latin-1 und Ukrainisch habe die kyrillische Schrift? Wo sollte es da Probleme geben?

      emu

      1. Hallo!

        Na dann mal viel Spaß "in der großen weiten Welt" ;-)

        Andreas

        (P.S.: am schönsten sind immer die Hinweise die überhaupt keine Lösung beinhalten. Nicht umsonst ist im Forumsarchiv eine ganze Menge zum Thema zu finden... bestimmt alles nur weil es so simpel ist?!...)

        1. Hallo!

          Na dann mal viel Spaß "in der großen weiten Welt" ;-)

          Ich nehme eben an, dass man auch in Russland einen Rechner bedienen kann, ohne sich mit Zeichensätzen auseinanderzusetzen. Insofern muss es funktionieren, insbesondere dann, wenn es sich viele russische Seiten leisten, gar keinen Zeichensatz anzugeben (sie verlassen sich also darauf, dass Windows Standard ist, oder dass der Browser gut raten kann).

          (P.S.: am schönsten sind immer die Hinweise die überhaupt keine Lösung beinhalten.

          Das hast du bereits erwähnt (</archiv/2002/9/22516/#m125680>). Nicht erwähnt hast du in </archiv/2002/7/17085/#m95813>, welche Benutzer mit welchen Einstellungen Probleme haben. Siehe auch </archiv/2002/7/17045/#m95567>.

          Nicht umsonst ist im Forumsarchiv eine ganze Menge zum Thema zu finden...

          Vor allem auch von dir. Eine wirklich brauchbare Lösung hast du auch nicht präsentieren können. Allerdings hast du auch nicht zeigen können, warum eine Lösung nicht funktionieren kann.

          emu