Gunnar Bittersmann: wegen charset

Beitrag lesen

Hi, :-)

ähm...
ich habe da irgendwie wohl wieder einen Block beim Denken.
Wenn ich die Unterstützung von mehreren Sprachen auf meiner Seite ermöglichen möchte, mache ich dann zwei mal meta http...? Mit zwei verschiedenen Angaben? Für Deutsch und ... meinetwegen Russisch?

Strator,
Du bringst hier zwei verschiedene Dinge durcheinander:
(1) die Sprache des Dokumentinhalts
(2) (Zeichensatz) besser: die Codierung der Zeichen

Der Unterschied wird deutlich, wenn du bedenkst, dass deutsch, englisch etc. in lateinischen Buchstaben geschrieben werden, russisch, bulgarisch etc. in kyrillischen. Serbokroatisch wird in lateinischen (kroatisch) oder kyrillischen (serbisch) Buchstaben geschrieben.

Eine gute Stelle, um (1) anzugeben, ist das <html>-Tag; bei lokalen Änderungen im Dokument die entsprechende Stelle:

<html lang="de">
  <head>
    <title>Deutsch u.a.</title>
  </head>
  <body>
    <p>Ein paar Worte deutsch</p>
    <p lang="en">Some English</p>
    <p>Wieder deutsch</p>
    <p lang="pl">Kilka słów po polsku</p>
    <p>Und weiter deutsch</p>
  </body>
</html>

Für (2) ist die Angabe <meta http-equiv="content-type" content="text/html; charset=X">, von der es nur eine gibt, die für das ganze Dokument gilt (wobei das, was der Server sagt, mehr gilt). Brauchst du nur westeuropäische Zeichen, kannst du als Codierung ISO 8859-1 wählen; brauchst du nur kyrillische Zeichen, kannst du ISO 8859-5 wählen; brauchst du deutsche Umlaute und kyrillische Zeichen, empfielt sich UTF-8, womit du sämtlische Unicode-Zeichen codieren kannst.

Siehe auch Kapitel http://de.selfhtml.org/inter/index.htm
Gunnar

--
"Nobody wins unless everybody wins." (Bruce Springsteen)