Gunnar Bittersmann: Viersprachige Website // Unicode-Frage

Beitrag lesen

Hi Karsten,

je nach Sprache verschiedene charset-Angaben an den Browser geschickt:

Nein. Die charset-Angeben sind in nicht von der Sprache abhängig, sondern von der tatsächlich verwendeten Zeichencodierung.

Englisch: content='text/html; iso-8859-1, windows-1252'

Da fehlt was und da ist was zu viel: content="text/html; charset=ISO-8859-1". Und es sollte mich sehr wundern, wäre an dieser Stelle die Angabe zweier Codierungen erlaubt.

Die deutschen Inhalte sind mit den entsprechenden entities für Umlaute etc. versehen.

Was bei der Codierung in ISO 8859-1 überhaupt nicht notwendig ist. In UTF-8 natürlich auch nicht.

Wie muß ich mir da die Vorgehensweise bei chinesische oder japanischen Schriftzeichen vorstellen?

Möglich wäre auch bei diesen die Codierung in ISO 8859-1 und numerische Referenzierung: グンナー. Praktikabel ist das nur für vereinzelte Wörter, sicher nicht für ganze chinesische oder japanische Texte.

Du solltest dich besser für eine Codierung entscheiden, mit der du alle im Dokument vorkommenden Zeichen codieren kannst. UTF-8 deckt alle Zeichen des Universal Character Sets (UCS) / Unicode ab, kannst du also für deutsche wie englische wie chinesische wie japanische Dokumente einsetzen.

Gruß,
Gunnar

--
„Weisheit ist nicht das Ergebnis der Schulbildung, sondern des lebenslangen Versuchs, sie zu erwerben.“ (Albert Einstein)