Fetz: Umlaute und Kodierungen

Hallo!

Habe im Moment ein Verständnisproblem mit Umlauten und Sonderzeichen.
Bisher habe ich brav für meine (X)HTML-Dokumente Entities für Sonderzeichen eingebaut. Jetzt habe ich mit Visual Studio 2005 Web Developer experimentiert und wunderte mich, ob es tatsächlich sein kann, dass es keine Funktion zum Ändern von Umlauten gibt (?).
Beim weiteren Grübeln, dachte ich darüber nach, ob chinesische oder koreanische Webdesigner ihre Dokumente vollständig mit Entities erstellen müssen? Da ich mir schon denken kann, dass dies wohl nicht der Fall ist, habe ich einfach mal auf http://sverige.se in den Quelltext geschaut. Und dort fand ich im Kopf die Kodierung UTF-8 und finde (selbst für die arabischen Zeichen) keinerlei Hinweise auf verwendete Entities - mit Ausnahme von &.
Beim Nachlesen unter http://de.selfhtml.org/html/allgemein/zeichen.htm#allgemeines
fand ich jedoch den Satz: "Dennoch gibt es einige Sonderfälle, in denen es sinnvoll ist, sich auf ASCII-Zeichen zu beschränken, um mögliche Probleme bei der Verarbeitung zu vermeiden."
Details zu den Sonderfällen finde ich leider nicht und frage mich jetzt natürlich, ob sverige.se es sich erlauben kann, dass es bei manchen internationalen Besuchern Probleme bei der Verarbeitung gibt?

Ich würde gerne wissen, ob man wirklich noch Entities benutzen sollte; bzw. wäre sehr dankbar, wenn jemand noch einen Link zu tiefer gehender Lektüre hätte, damit auch ich das verstehen kann.

Vorab vielen Dank.

Gruß, Fetz

  1. Ich würde gerne wissen, ob man wirklich noch Entities benutzen sollte;

    „Nein, aber …“

    Vorausgesetzt, die gesamte Produktion vom Editor über die Datenbank bishin zu extern angelieferten Inhalten ist UTF-8-fähig oder bereits in UTF-8 kodiert. Dann wirst du mit UTF-8 richtig glücklich werden. Ist allerdings nur ein Glied nicht imstande, mit UTF-8 korrekt umzugehen, handelst du dir lästige Kodierungs-Orgien ein. Der große Vorteil einer Umstellung ist der Verzicht auf lästige, in jeder ISO-Kodierung erforderliche Entities. Du kannst ohne Rücksicht Texte, Satzzeichen usw. tippen.

    Alleine für deutsche Umlaute lohnt sich eine Umstellung allerdings nicht, diese sind in ISO-8859-1 ohnehin vorhanden.

    bzw. wäre sehr dankbar, wenn jemand noch einen Link zu tiefer gehender Lektüre hätte, damit auch ich das verstehen kann.

    Diverse Ressourcen:

    Wikipedia: UTF-8
    Feature-Artikel: UTF-8
    dciwam: Entities & Umlaute, Checkliste Zeichenkodierung
    Unicode and Character Sets

    Aus dem Archiv gefischt:

    UTF-8 versus ISO-8859-1
    XHTML und UTF-8
    ISO-* → UTF-8 (Editor)
    ISO-* → UTF-8 (PHP)
    Konvertierungs-Script (ungetestet)

    Roland

    --
    privoffblaha:)
    1. Hallo Roland.

      Danke für dieses Referenzposting. → Bookmark

      Einen schönen Sonntag noch.

      Gruß, Mathias

      --
      sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:} fl:( ss:) ls:[ js:|
      debian/rules
    2. Hallo Roland!

      Herzlichen Dank für Deine Mühe!
      Ich hoffe, ich kapiere das. Angesichts der Fülle an Lesestoff sollten ja keine Fragen offen bleiben - ansonsten hake ich einfach nochmal nach :-)

      Gruß, Fetz