Russische Website erstellen
Peter Mayr
- html
Hallo allerseits!
Probiere derzeit eine russische Website zu erstellen und möchte nun gerne wissen ob schon jemand mal eine gemacht hat und mir ein paar Tipps geben kann. Reicht es wenn ich im Head Bereich die ISO Nr. ändere oder muss ich auch etwas auf dem Server ändern? Ist es sinnvoll im Quelltext nur die ISO Nr. anzugeben anstatt dem Richtigen Text und falls schon gibt es ein Programm welches das macht?
Probiere derzeit eine russische Website zu erstellen und möchte nun gerne wissen ob schon jemand mal eine gemacht hat
Viele. (Nicht ich viele, sondern viele welche.)
Ist es sinnvoll im Quelltext nur die ISO Nr. anzugeben anstatt dem Richtigen Text
???
Schon mal im Archiv nach "russisch" gesucht?
Gunnar
Ok, ein wenig genauer mein Problem:
Also mit dem richtigen Text meinte ich soetwas wie es auch Word macht. Habe die Übersetzung natürlich in einem Word Dokument erhalten und habe einmal versucht was Word mit einer russischen Website macht. Word ersetzt alle russische Schriftzeichen durch deren ISO Code. Möchte nun wissen ob es reicht wenn ich im Head Bereich den ISO Code anpasse und im body dann die russischen Schriftzeichen einsetzte oder ob ich besser gleich im ganzen Dokument für jeden russischen Buchstaben den ISO Code schreibe. Denke dass es mit unseren Umlauten das gleiche ist. Ich kann sie im body Text lassen, jedoch verstehen sie die alten Browser nicht. Und dann würde ich natürlich ein Programm suchen welches alle russischen Schriftzeichen in den ISO Code umwandelt (wie es auch Word macht)
Hallo Peter,
warum tust du nicht, wonach Gunnar dich gefragt hat?
Also, hast du schon mal im Archiv nach "russisch" gesucht?
Ich kann mich sehr gut erinnern, dass es hier schon mehrmals Threads zu
diesem Thema gab.
Wenn du nicht wissen soltest, wie du das Archiv durchsuchen kannst:
Auf der Forumshauptseite findest du an der linken Seite den Link Suche,
dort kannst du dann als Suchbegriff russisch eingeben.
Wenn du dir die Suchergebnisse selbst (SELF) durchgelesen hast und dann
noch weitere Fragen hast, kannst du diese gern hier (in diesem Thread)
stellen.
Auf Wiederlesen
Detlef
Hi Detlef,
ich hatte vor kurzem selber diese Frage gestellt. Alle Fragen des Ausgangsposters wurden dort aber nicht beantwortet und das Archiv bringt auch nicht alle Antworten. Ich hatte vorher gesucht und auch bei Google geguckt. Ganz trivial ist das Ganze nämlich nicht.
An den Ausgnagsposter: Guck im Archiv auch mal unter "Übersetzung".
Viele Grüße
Mathias Bigge
Sagt mal warum könnt ihr mir nicht einfach meine Frage beantworten anstatt mich ins Archiv zu schicken? Glaubt ihr dass ich dort noch nicht gesucht habe? Ich habe mir die ersten paar Einträge angesehen und dort nichts gefunden, also habe ich gepostet. Das ist doch der Sinn eines Forums, oder etwa nicht? Sonst könnte ich ja gleich googeln, irgendwann werde ich schon was finden. Finde ich nicht wirklich hilfreich von euch und ihr zerstörrt die Funktion eines Forums. Also kann mir vielleicht bitte jemand erklären ob es notwendig ist jedes Schriftzeichen in dessen ISO Code umzuwandeln.
Hallo Peter,
Sagt mal warum könnt ihr mir nicht einfach meine Frage beantworten anstatt mich ins Archiv zu schicken?
bei sowas hilft immer, die Ausgangssitutation genauer zu beschreiben: "war schon im Archiv, habe dort nichts für mich passendes gefunden."
Um russische Seiten zu erstellen, ist es vermutlich sinnvoller, gleich Unicode einzusetzen. Entscheidend ist imho jedoch, daß der Server diesen auch ausliefert (was meiner z.B. nicht tut :-( ...), sonst kannst Du im head reinschreiben, was Du willst.
Sicherer (aber auch unübersichtlicher) bist Du, wenn Du den Text in Unicode schreibst, und dann in entities umwandelst. Ziemlich mühsam.
Inwieweit Du mit der htaccess den Server dazu "überreden" kannst, Unicode auszuliefern, weiß ich nicht, aber da hilft Google oder das Archiv vielleicht wirklich.
Viel Erfolg.
Gruß aus Köln-Ehrenfeld,
Elya
Also kann mir vielleicht bitte jemand erklären ob es notwendig ist jedes Schriftzeichen in dessen ISO Code umzuwandeln.
Peter,
Kannst du erstmal erklären, was du mit "in dessen ISO Code umwandeln" meinst?
Glaskugel: Meinst du damit, für "русский" рутский zu schreiben?
Nein, musst du nicht.
Du kannst auch dein Dokument in ISO 8859-5 codieren (dann aber nicht gleichzeitig deutsche Umlaute im Dokument haben) oder in UTF-8. Das setzt entsprechende Möglichkeiten des Textverarbeitungsprogramms voraus.
Auf jeden Fall ist dann die verwendete Codierung anzugeben, bei text/html in der <meta http-equiv="content-type">-Angabe.
Gunnar
Hallo Gunnar
Auf jeden Fall ist dann die verwendete Codierung anzugeben, bei text/html in der <meta http-equiv="content-type">-Angabe.
Was aber nur hilft, wenn der Server im Header keine andere Codierung angibt.
Auf Wiederlesen
Detlef
Danke Gunnar, deine Glaskugel war sogar richtig ;)
Du kannst auch dein Dokument in ISO 8859-5 codieren (dann aber nicht gleichzeitig deutsche Umlaute im Dokument haben) oder in UTF-8. Das setzt entsprechende Möglichkeiten des Textverarbeitungsprogramms voraus.
Okay, du sagst dass ich es nicht muss, sondern eine ISO Definition im Head Bereich reicht aus. Ist das auch empfehlenswert oder ist das mit рутский sicherer? Es sollte 100prozentig funktionieren, wenn möglich auf jedem Server ohne Voreinstellungen. Und kannst du mir eventuell einen Tipp geben welches Programm den russischen Text automatisch in рутский umwandelt?
Vielen Dank
Danke Gunnar, deine Glaskugel war sogar richtig ;)
Peter,
Dann meintest du also mit "ISO-Code" ISO 10646? Mit "Unicode" hätte jeder hier mehr anfangen können.
sondern eine ISO Definition im Head Bereich reicht aus.
Ich glaub nicht, dass du die Macht hast, um Standards zu _definieren_.
Ist das auch empfehlenswert oder ist das mit рутский sicherer? Es sollte 100prozentig funktionieren,
Mit Letzterem bist du auf der sicheren Seite, da keine kyrillischen, sondern nur 7-Bit-ASCII-Zeichen im Quelltext vorkommen.
100prozentig kann die Anzeige beim Nutzer nicht funktionieren, weil du keinen Einfluss darauf hast, ob dieser kyrillische Zeichen auf seinem System installiert hat.
welches Programm den russischen Text automatisch in рутский umwandelt?
MS Word (mein 2000er jedenfalls) tut das, wenn du "als HTML" abspeicherst, nur dass es die Nummern dezimal statt hexadezimal darstellt. Da kannst du es dann herauskopieren, denn was Word noch so macht, siehe https://forum.selfhtml.org/?t=91740&m=552164
Für "empfehlenswert" halte ich allerdings einen UTF-8-fähigen Editor, darin ist dein russischer Text Quelltext für dich lesbar. Wenn dein Webserver die Seiten als UTF-8 rausschickt, wenn du das so angibst (was er sollte), ist alles OK.
Gunnar
Hallo Peter,
der Hinweis auf die Archivsuche sollte wirklich Hilfe sein.
Mit diesem Thema habe ich mich bisher nicht wirklich beschäftigen müssen,
kann mich aber gut daran erinnern, dass es dazu mehrere Threads im Archiv
gibt.
Ich habe mir jetzt mal die Mühe gemacht, die Suche nach russisch und kyrillisch
zu bemühen, und dort die Suchergebnisse durchzugehen. Das solltest du auch
ruhig einmal tun. Es steht dort zwar vieles, was dir nicht weiterhelfen
wird, aber auch viele Hinweise und auch weiterführende Links, die dir
bestimmt weiterhelfen dürften. Daran siehst du auch, dass deine Frage nicht
wirklich einfach und allgemeingülig beantwortet werden kann.
Sagt mal warum könnt ihr mir nicht einfach meine Frage beantworten anstatt mich ins Archiv zu schicken?
Weil dies das SELF-Forum und keine Antwort-Hotline ist.
Glaubt ihr dass ich dort noch nicht gesucht habe?
Genau das habe ich angenommen, weil du weder in deinem ersten Posting noch
auf Gunnars diesbezügliche Frage dergleichen erwähnt hast.
... Das ist doch der Sinn eines Forums, oder etwa nicht? Sonst könnte ich ja gleich googeln, irgendwann werde ich schon was finden.
Genau _das_ sollst du tun!
(siehe Einleitung zu diesem Forum: "Es wird erwartet, daß bei Problemen erst
einmal in SELFHTML, im Kapitel Forumsarchiv oder in anderen Quellen nach
einer Lösung gesucht wird.")
Wenn du dort nichts findest, mit dem Gefundenen nicht klar kommst oder
weiterführende Fragen bleiben, wird hier gern geholfen, sofern jemand
Erfahrungen mit dem Thema hat.
Finde ich nicht wirklich hilfreich von euch und ihr zerstörrt die Funktion eines Forums.
Dieses Forum soll Hilfe zur Selbsthilfe sein, keine Antwortmaschine.
Auf Wiederlesen
Detlef
Hallo, Peter,
Probiere derzeit eine russische Website zu erstellen und möchte nun gerne wissen ob schon jemand mal eine gemacht hat und mir ein paar Tipps geben kann. Reicht es wenn ich im Head Bereich die ISO Nr. ändere oder muss ich auch etwas auf dem Server ändern? Ist es sinnvoll im Quelltext nur die ISO Nr. anzugeben anstatt dem Richtigen Text und falls schon gibt es ein Programm welches das macht?
ich habe es schon mal eine russische Seite erstellt und es war ein Alptraum! Letztendlich habe ich mir die Texte als Unicode-Datei anliefern lassen und habe diese dann mit einem Tool in erweiterten ASCII-Code konvertiert.
Als content-type habe ich im HTML-Code "windows-1251" angegeben, weil sich dies wohl aus "historischen" Gründen durchgesetzt hat. "iso-8859-1" sollte aber auch gehen ...
In Zukunft würde ich solche Seiten nicht mehr in "Handarbeit" erstellen, sondern mit einem für Mehrsprachigkeit ausgelegten Content-Management-System, z.B. typo3 ...
Hier noch ein paar Links zum Thema ...
[Link:http://ourworld.compuserve.com/homepages/PaulGor/nof_main.htm]
[Link:http://ourworld.compuserve.com/homepages/PaulGor/r_linksn.htm]
[Link:http://ourworld.compuserve.com/homepages/paulgor/cpage_e.htm]
[Link:http://www.alanwood.net/unicode/htmlunicode.html]
[Link:http://www.moosburg.org/design/kyrill.html]
[Link:http://www.pinkrus.ch/russsifiz.htm]
[Link:http://www.siber.com/sib/russify/]
[Link:http://www.i18ngurus.com/docs/984813247.html]
[Link:http://www.unipad.org/main/]
Viel Erfolg! Grüße,
Sebastian
Sebastian,
in erweiterten ASCII-Code konvertiert.
??? Was immer das ist...
Als content-type habe ich im HTML-Code "windows-1251" angegeben, weil sich dies wohl aus "historischen" Gründen durchgesetzt hat.
Nein, hat es nicht. Windows-Zeichensatz ist kein Standard. Erwarte nicht, dass andere Browser/Systeme als IE/Windows das verstehen.
"iso-8859-1" sollte aber auch gehen ...
Nein, damit kannst du keine kyrillischen Zeichen codieren.
Hier noch ein paar Links zum Thema ...
SELFHTML: Internationalisierung
Gunnar
Hallo, Gunnar,
in erweiterten ASCII-Code konvertiert.
??? Was immer das ist...
ASCII = American Standard Code for Information-Interchange
8-Bit-Code für Computer, Programme und Zeichensätze, dessen Codes von 0 bis 127 mit dem gewöhnlichen ASCII-Code übereinstimmen und bei dem den Codes 128 bis 255 Sonderzeichen (Akzente, Umlaute, etc.) und Blockgraphikzeichen zugeordnet sind. Diese zusätzlichen Zeichen variieren z.B in Abhängigkeit von der Spracheinstellung, z.B. kyrillisch ...
A0-AF _ Ў ў Ј ¤ Ґ ¦ § Ё © Є « ¬ _ ® Ї
B0-BF ° ± І і ґ µ ¶ · ё № є » ј Ѕ ѕ ї
C0-CF А Б В Г Д Е Ж З И Й К Л М Н О П
D0-DF Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
E0-EF а б в г д е ж з и й к л м н о п
F0-FF р с т у ф х ц ч ш щ ъ ы ь э ю я
Die Zeichen werden hier richtig dargestellt, weil sie als HTML-Entities maskiert wurden. Mit dieser Methode geht man übrigens auf Nummer sicher - leider sieht dann der Quelltext grauenhaft aus ...
Als content-type habe ich im HTML-Code "windows-1251" angegeben, weil sich dies wohl aus "historischen" Gründen durchgesetzt hat.
Nein, hat es nicht. Windows-Zeichensatz ist kein Standard. Erwarte nicht, dass andere Browser/Systeme als IE/Windows das verstehen.
Schlaumeier! windows-1251 hat sich de facto durchgesetzt und wir daher auch von den meisten Browsern unterstützt.
Most Russian-language Web pages (more than 90% for sure) are made nowadays in Windows-1251 encoding a.k.a. "Cyrillic(Windows)", just because the majority of authors work under MS Windows nowadays and 1251 is what Microsoft uses for Cyrillic, so built-in Windows Cyrillic fonts and keyboard tools are for Windows-1251 encoding.
Therefore it's much easier to type some "Cyrillic(Windows-1251)" encoding text in a Windows plain text editor than to type a "Cyrillic(KOI8-R)" encoding text.
Quelle:
[Link:http://ourworld.compuserve.com/homepages/PaulGor/cpage_e.htm]
"iso-8859-1" sollte aber auch gehen ...
Nein, damit kannst du keine kyrillischen Zeichen codieren.
Da hast Du ausnahmsweise mal Recht. ;-)
Ich hatte mich vertan - gemeint ist natürlich iso-8859-5. Dazu heißt es allerdings auf der oben verlinkten Seite ...
It's practically impossible to type "Cyrillic, ISO-8859-5" encoding text.
But it really does not matter which encoding the author used - major browsers work fine with all Cyrillic encodings and as long as a Web page is done correctly [...]
Zukunftsweisender ist allerdings UTF-8 - das wird z.B. von der russischen Version von Google verwendet ...
[Link:http://www.google.ru]
Grüße,
Sebastian
Hi Sebastian,
ASCII = American Standard Code for Information-Interchange
8-Bit-Code
Nein. ASCII ist 7-Bit-Code.
dessen Codes von 0 bis 127 mit dem gewöhnlichen ASCII-Code übereinstimmen
Es gibt keinen ungewöhnlichen ASCII-Code.
und bei dem den Codes 128 bis 255 Sonderzeichen (Akzente, Umlaute, etc.) und Blockgraphikzeichen zugeordnet sind.
Das ist nicht ASCII. Du sprichst hier von ISO 8859 bzw. dem MS-DOS-Zeichensatz.
Diese zusätzlichen Zeichen variieren z.B in Abhängigkeit von der Spracheinstellung, z.B. kyrillisch ...
Nein. Diese zusätzlichen Zeichen variieren in Abhängigkeit, ob ISO 8859-1, ISO 8859-2, ISO 8859-3, ..., oder eben MS-DOS-Zeichensatz.
Schlaumeier! windows-1251 hat sich de facto durchgesetzt und wir daher auch von den meisten Browsern unterstützt.
Mozilla unter UNIX? Muss ich morgen glatt mal probieren.
just because the majority of authors work under MS Windows nowadays and 1251 is what Microsoft uses for Cyrillic,
ROTFL. Was hat das mit Standard zu tun?
[Link:http://www.google.ru]
Wenn du "link" klein schreibst, dann klappt's auch mit dem Verlinken.
Grüße aus Friedrichshain,
Gunnar
Windows-1251 is an 8-bit character encoding, designed to cover languages that use the Cyrillic alphabet such as Russian and other languages.
Windows-1251 and KOI8-R (or its Ukrainian variant KOI8-U) are much more commonly used than ISO 8859-5, which never really caught on. In recent times, both might eventually give way to Unicode.
Wikipedia, the free encyclopedia
[Link:http://en.wikipedia.org/wiki/Windows-1251]