Johannes Zeller: Sprachen und Ihre Tücken

Beitrag lesen

Hallo Gunnar,

(de, en, fr, it, pt, etz)

etz?? Solch Sprachkürzel gibt es nicht. Wofür sollte das stehen?

etz ist gemäß ISO 639-3 der Code für die Sprache Semimi.

Eine Umwandlung in Zeichen-Entity-Referenzen ist nicht nötig, wenn eine Zeichencodierung verwendet wird, mit der sich die benötigten Zeichen codieren lassen. Für die meisten westeuropäische Sprachen sollte es ISO 8859-1 tun.

Aktueller ist ISO 8859-15, dies enthält u.a. auch das Euro-Zeichen.

Für die in osteuropäischen Sprachen mit lateinischer Schrift benötigten „Sonderzeichen“ gibt es keine Entities; in HTML wurde bspw. keine Entity 'aogonek' für das Zeichen 'ą' oder 'ccaron' für 'č' definiert.

Für kyrillische Zeichen gibt es auch keine Entities; wohl aber für die griechischen. [SELFHTML]

Hättest du die Seite genauer gelesen, wüsstest du, dass es auch numerische Referenzen gibt. Somit lassen sich auch alle Zeichen aus dem Unicode-Zeichenvorrat in einem HTML-Dokument darstellen, wenn dieses beispielsweise in ISO 8859-1 vorliegt.

Gruß,

Johannes