Umlaute und Kodierungen
Fetz
- html
4 Orlando0 Mathias Brodala0 Fetz
Hallo!
Habe im Moment ein Verständnisproblem mit Umlauten und Sonderzeichen.
Bisher habe ich brav für meine (X)HTML-Dokumente Entities für Sonderzeichen eingebaut. Jetzt habe ich mit Visual Studio 2005 Web Developer experimentiert und wunderte mich, ob es tatsächlich sein kann, dass es keine Funktion zum Ändern von Umlauten gibt (?).
Beim weiteren Grübeln, dachte ich darüber nach, ob chinesische oder koreanische Webdesigner ihre Dokumente vollständig mit Entities erstellen müssen? Da ich mir schon denken kann, dass dies wohl nicht der Fall ist, habe ich einfach mal auf http://sverige.se in den Quelltext geschaut. Und dort fand ich im Kopf die Kodierung UTF-8 und finde (selbst für die arabischen Zeichen) keinerlei Hinweise auf verwendete Entities - mit Ausnahme von &.
Beim Nachlesen unter http://de.selfhtml.org/html/allgemein/zeichen.htm#allgemeines
fand ich jedoch den Satz: "Dennoch gibt es einige Sonderfälle, in denen es sinnvoll ist, sich auf ASCII-Zeichen zu beschränken, um mögliche Probleme bei der Verarbeitung zu vermeiden."
Details zu den Sonderfällen finde ich leider nicht und frage mich jetzt natürlich, ob sverige.se es sich erlauben kann, dass es bei manchen internationalen Besuchern Probleme bei der Verarbeitung gibt?
Ich würde gerne wissen, ob man wirklich noch Entities benutzen sollte; bzw. wäre sehr dankbar, wenn jemand noch einen Link zu tiefer gehender Lektüre hätte, damit auch ich das verstehen kann.
Vorab vielen Dank.
Gruß, Fetz
Ich würde gerne wissen, ob man wirklich noch Entities benutzen sollte;
„Nein, aber …“
Vorausgesetzt, die gesamte Produktion vom Editor über die Datenbank bishin zu extern angelieferten Inhalten ist UTF-8-fähig oder bereits in UTF-8 kodiert. Dann wirst du mit UTF-8 richtig glücklich werden. Ist allerdings nur ein Glied nicht imstande, mit UTF-8 korrekt umzugehen, handelst du dir lästige Kodierungs-Orgien ein. Der große Vorteil einer Umstellung ist der Verzicht auf lästige, in jeder ISO-Kodierung erforderliche Entities. Du kannst ohne Rücksicht Texte, Satzzeichen usw. tippen.
Alleine für deutsche Umlaute lohnt sich eine Umstellung allerdings nicht, diese sind in ISO-8859-1 ohnehin vorhanden.
bzw. wäre sehr dankbar, wenn jemand noch einen Link zu tiefer gehender Lektüre hätte, damit auch ich das verstehen kann.
Diverse Ressourcen:
Wikipedia: UTF-8
Feature-Artikel: UTF-8
dciwam: Entities & Umlaute, Checkliste Zeichenkodierung
Unicode and Character Sets
Aus dem Archiv gefischt:
UTF-8 versus ISO-8859-1
XHTML und UTF-8
ISO-* → UTF-8 (Editor)
ISO-* → UTF-8 (PHP)
Konvertierungs-Script (ungetestet)
Roland
Hallo Roland.
Danke für dieses Referenzposting. → Bookmark
Einen schönen Sonntag noch.
Gruß, Mathias
Hallo Roland!
Herzlichen Dank für Deine Mühe!
Ich hoffe, ich kapiere das. Angesichts der Fülle an Lesestoff sollten ja keine Fragen offen bleiben - ansonsten hake ich einfach nochmal nach :-)
Gruß, Fetz