mehrsprachige Seiten
Wolfgang Erdmann
- html
Hallo,
ich will eine z.Z. 2-sprachige Site für einen Verein (siehe URL) entwickeln (Deutsch und Russisch, später mehr). Neben einigen statischen Seiten wird der größere Teil der Inhalte per ASP aus einer Datenbank kommen.
Nun soll jeder 'seine' Sprache angeboten bekommen. Der Versuch, den entsprechenden Meta-Tag zu manipulieren (5988-5 für Russisch) hat aber ganz humorlos gar nix gebracht, nur Text in lateinischen Buchstaben.
Gegebenenfalls ist UTF-8 eine Alternative, aber dann steht folgende Frage: Wenn ich z.B. ein Erfassungsformular anbiete, wie gelangen dann die Daten mit dem entsprechenden Offset in die Datenbank? Ich hoffe, wenn das korrekt gelaufen ist, dann ist die richtige Darstellung kein Problem mehr.
BTW eine offtopic-Frage: Wo findet man denn fremdsprachige Tastaturlayouts, um mal was testen zu können?
Dank an alle, die sich deswegen bemühen
Wolfgang
Nun soll jeder 'seine' Sprache angeboten bekommen. Der Versuch, den entsprechenden Meta-Tag zu manipulieren (5988-5 für Russisch) hat aber ganz humorlos gar nix gebracht, nur Text in lateinischen Buchstaben.
Du meinst sicherlich nicht "Sprache", sondern den Zeichensatz. Der Hinweis, daß der "entsprechende Meta-Tag" nichts gebracht hat, ist leider reichlich nebulös. Es gibt hunderte Meta-Tags und nochmal soviele <meta>-Eigenkreationen. Und selbst wenn Du jenen mit "content-type" meinst, ist noch lange nicht gesagt, daß Du ihn richtig benutzt. Kurz: Sage doch bitte _genau_, was Du gemacht hast.
Aus Deiner obigen Beschreibung möchte ich aber mal in's Blaue hinein vermuten, daß Du nicht 5988-5 meinst, sondern ISO-8859-5 (Groß-/Kleinschreibung zählt IIRC auch). Korrigere dies in Deinen Seiten, wenn nötig.
Unicode ist davon unabhängig wohl vorzuziehen.
Die <meta>-Angabe ist übrigens nur zweite Wahl, ein Ersatz für alle diejenigen, die nicht direkt auf den gleichnamigen Teil des HTTP-Protokolls zugreifen können.
Gegebenenfalls ist UTF-8 eine Alternative, aber dann steht folgende Frage: Wenn ich z.B. ein Erfassungsformular anbiete, wie gelangen dann die Daten mit dem entsprechenden Offset in die Datenbank?
Was meinst Du mit "entsprechendem Offset"? Da können einem auf Anhieb ein halbes Dutzend "Offsets" zu einfallen, von den Spuren und Blöcken der Festplatte bis zu den Feldvariablen des Programms, das das Formular verarbeitet.
Vielleicht solltest Du mal in die Anleitung Deiner Datenbank schauen, es ist gut möglich, daß sie mit Unicode umgehen kann.
Gruß,
soenk.e
Hallo,
hier mal der korrekte Meta-Tag:
META http-equiv=Content-Type content="text/html; charset=windows-1251"
Wo jetzt 'windows-1251' steht, hatte ich vorher 'ISO-8859-5' verwendet (war nur ein Tippfehler beim Posten).
Inzwischen habe ich mal einige russische Seiten im Quelltext erforscht. Die verwenden die o.g. charset- Angabe. Bei den Texten habe ich die ASCII-Codes betrachtet; die liegen alle unter 256.
Was UTF-8 betrifft, so hat der Zeichensatz da wohl ca. 64.000 Zeichen. Für die verschiedenen Sprachen steht jeweils ein bestimmter Bereich zur Verfügung, was ich mit Offset umschrieben habe. Ist nur die Frage, welcher Bereich das ist.
Und es bleibt weiterhin die Frage, wenn ich denn UTF-8 verwende, wie mein Formular begreift und in die Datenbank schreibt, was der Nutzer mir mitteilen wollte.
Trotzdem vielen Dank
Wolfgang
Hi,
Der Versuch, den entsprechenden Meta-Tag zu manipulieren (5988-5 für Russisch) hat aber ganz humorlos gar nix gebracht, nur Text in lateinischen Buchstaben.
Könnte daran gelegen haben, daß iso-5988-5 nicht das selbe ist wie iso-8859-5...
cu,
Andreas