Achim: Erneut Probleme mit Umlauten

Seit ein paar Tagen habe ich wieder verstärkt Umlautprobleme bei der Darstellung meiner Seiten (sowohl mit FF 3.5 als auch IE8.

Meine Header sehen nun fast alle so aus:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="de-DE"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8">...

Damit sollte es doch eigentlich egal sein, ob ich Umlaute oder die HTML-Codierung von diesen verwende, oder?
Leider ist es aber nicht so und ich kann mir nicht erklären, was der Fehler ist.
Hier ein Beispiel: http://www.spruecheportal.de/saint-exupery.php - mit Fehlern
und hier: http://www.spruecheportal.de/nietzsche.php keine.

Wahrscheinlich habe ich irgendetwas übersehen, oder?

Danke für Eure Hilfe,
Gruß Achim

  1. hi,

    Damit sollte es doch eigentlich egal sein, ob ich Umlaute oder die HTML-Codierung von diesen verwende, oder?

    Klar. Bis auf eine klitzekleine Kleinigkeit: Dein Editor sollte die Zeichen auch utf-8 kodiert abspeichern. Hinweis: Beim "Speichern unter..." in unicode bekommt die Datei eine BOM (Bit Order Mark) in die erste Zeile, das muss raus.

    Hotti

    --
    Wenn der Kommentar nicht zum Code passt, kann auch der Code falsch sein.
    1. @@hotti:

      nuqneH

      Hinweis: Beim "Speichern unter..." in unicode […]

      Hinweis: Unicode ist keine Zeichencodierung.

      […] bekommt die Datei eine BOM (Bit Order Mark) in die erste Zeile, das muss raus.

      Laut UTF-8 BOM tester ist kein BOM drin.

      Sollte auch nicht. [QA-UTF8-BOM]

      Qapla'

      --
      Bildung lässt sich nicht downloaden. (Günther Jauch)
      1. Laut UTF-8 BOM tester ist kein BOM drin.

        Sollte auch nicht. [QA-UTF8-BOM]

        Qapla'

        Das ist also nicht das Problem, richtig?

  2. Hallo,

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="de-DE"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    Damit sollte es doch eigentlich egal sein, ob ich Umlaute oder die HTML-Codierung von diesen verwende, oder?

    ja, wenn du sie richtig verwendest.

    Hier ein Beispiel: http://www.spruecheportal.de/saint-exupery.php - mit Fehlern

    Der Server macht keine Angaben zur Zeichencodierung, daher gilt ausnahmsweise die Angabe in deinem meta-Element: UTF-8. Allerdings ist das Dokument nicht in UTF-8 gespeichert, sondern in irgendeiner ISO-8859-x. Daher die Anzeigefehler, weil ein in ISO codierter Umlaut nunmal für UTF-8 eine ungültige Bytefolge ist.

    und hier: http://www.spruecheportal.de/nietzsche.php keine.

    Kein Wunder: Hier hast du alle Umlaute in Entity-Schreibweise drin.

    Wahrscheinlich habe ich irgendetwas übersehen, oder?

    Ja: Wenn man auf eine Kiste "Bananen" schreibt, sollte man auch Bananen reintun, und keine Aprikosen.

    Ciao,
     Martin

    --
    TEAM: Toll, Ein Anderer Macht's.
    1. Allerdings ist das Dokument nicht in UTF-8 gespeichert, sondern in irgendeiner ISO-8859-x. Daher die Anzeigefehler, weil ein in ISO codierter Umlaut nunmal für UTF-8 eine ungültige Bytefolge ist.

      ok, danke, das ist verständlich.
      Ich arbeite mit phase 5.6 bin mir aber nicht sicher, ob man das dort einstellen kann - ich hoffe doch. Eigentlich ist das ein recht gutes Tool. Hoffentlich ist es dann gelöst.

  3. @@Achim:

    nuqneH

    <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="de-DE">

    Die Sprache solltest du mit @lang und @xml:lang angeben. [SELFHTML, I18N-HTML-TECH-LANG]

    Und warum "de-DE"? Willst du Österreicher und Schweizer als Zielpublikum ausschließen? Verwende "de"!

    Auf @dir kannst du verzichten, "ltr" ist Default.

    Also: <html xmlns="http://www.w3.org/1999/xhtml" lang="de" xml:lang="de">

    Damit sollte es doch eigentlich egal sein, ob ich Umlaute oder die HTML-Codierung von diesen verwende, oder?

    „Egal“ in dem Sinne, dass beides funktionieren sollte.

    Du solltest Umlaute verwenden, keine HTML-Zeichenreferenzen. [QA-ESCAPES]

    Hier ein Beispiel: http://www.spruecheportal.de/saint-exupery.php - mit Fehlern

    Wie [hotti] sagte: Du hast diese Datei nicht in UTF-8 gespeichert, sondern in ISO 8859-1 o.ä.

    Qapla'

    --
    Bildung lässt sich nicht downloaden. (Günther Jauch)
    1. Hi!

      Und warum "de-DE"? Willst du Österreicher und Schweizer als Zielpublikum ausschließen? Verwende "de"!

      Das Argument versteh ich nicht. Wieso Zielpublikum und wieso ausschließen? Die lang-Angabe gibt doch an, in welcher Sprache der Text verfasst ist und nicht wer ihn lesen soll. Wenn der Autor "deutsches Deutsch" verwendet hat, finde ich das genauso in Ordnung, als wenn da Jänner verwendet würde und der Text als de-AT ausgezeichnet wäre.

      Lo!

      1. @@dedlfix:

        nuqneH

        Und warum "de-DE"? Willst du Österreicher und Schweizer als Zielpublikum ausschließen? Verwende "de"!

        Das Argument versteh ich nicht.

        Geistige Umnachtung? Meinerseits, nicht deinerseits.

        Wieso Zielpublikum

        @lang/@xml:lang gibt natürlich nicht das Zielpublikum an.

        und wieso ausschließen?

        Bei language negotiation würde es nicht matchen, wenn ein Dokument als "de-DE" gekennzeichnet ist, der Nutzer aber in seinem Browser "de-AT, de" eingestellt hat. Auch das hat mit @lang/@xml:lang nichts zu tun.

        Wenn der Autor "deutsches Deutsch" verwendet hat, finde ich das genauso in Ordnung, als wenn da Jänner verwendet würde und der Text als de-AT ausgezeichnet wäre.

        Anyway, “you should only use region subtags if they are necessary to make a distinction you need. Unless you specifically need to highlight that you are talking about Italian as spoken in Italy you should use it for Italian, and not it-IT. The same goes for any other possible combination.” [LANGUAGE-TAGS]

        Ich sehe (außer in äußerst speziellen Fällen) keinen triftigen Grund, zwischen de-DE, de-AT und de-CH zu unterscheiden. Man gibt ja auch keinen obskuren Dialekt an, wenn man „an Weihnachten“ statt „zu Weihnachten“ oder „Viertel nach eins“ statt „Viertel zwei“ schreibt.

        Im Englischen sieht es wegen der unterschiedlichen Orthographie en-GB/en-US (colour/color, organisation/organization etc.) schon anders aus.

        Qapla'

        --
        Bildung lässt sich nicht downloaden. (Günther Jauch)
        1. Hallo,

          Ich sehe (außer in äußerst speziellen Fällen) keinen triftigen Grund, zwischen de-DE, de-AT und de-CH zu unterscheiden.
          Im Englischen sieht es wegen der unterschiedlichen Orthographie en-GB/en-US (colour/color, organisation/organization etc.) schon anders aus.

          nein, eigentlich nicht. Denn auch wenn Briten und Amerikaner teils etwas unterschiedliche Schreibweisen haben, teils sogar unterschiedliche Ausdrücke (z.B. Kofferraum: trunk [AE], boot [BE]), verstehen sie die jeweils andere Variante in der Regel auch problemlos - ebenso wie wir Deutschen normalerweise auch die spezifischen Eigenheiten der Österreicher verstehen. Daher sehe ich hier auch keinen Grund, beispielsweise die Sprachvariante en-US anzugeben und damit zu riskieren, dass jemand, der en-GB wünscht, leer ausgeht, obwohl man ihm etwas liefern könnte, was seinem Wunsch zumindest sehr nahe kommt. Ich halte eine generische Angabe (de, en) daher für sinnvoller.

          Schönes Wochenende,
           Martin

          --
          Lieber eine Fliege im Porzellanladen
          als ein Elefant in der Suppe.
          1. @@Der Martin:

            nuqneH

            Daher sehe ich hier auch keinen Grund, beispielsweise die Sprachvariante en-US anzugeben und damit zu riskieren, dass jemand, der en-GB wünscht, leer ausgeht, obwohl man ihm etwas liefern könnte, was seinem Wunsch zumindest sehr nahe kommt.

            Wie gesagt, bei @lang/@xml:lang geht weder um Auslieferung noch ums Zielpublikum. Es ist die Angabe der Text(verarbeitungs)sprache. [LANGUAGE-DECL, I18N-HTML-TECH-LANG §§4–6]

            @lang/@xml:lang könnte auch für eine Rechtschreibprüfung relevant sein: Bei
              <p lang="en-US">In British English, “color” is spelled “colour.”</p>
            würde "colour" angemeckert werden,
              <p lang="en-US">In British English, “color” is spelled “<span lang="en-gb">colour</span>.”</p>
            ist fehlerfrei.

            Ich halte eine generische Angabe (de, en) daher für sinnvoller.

            Im Deutschen treten verschiedene Schreibweisen eines Wortes kaum auf (aber: „Geschoss“/„Geschoß“*). Auch ist der Unterschied zwischen einem norddeutschen und einem bayrischen Dialekt (beides "de-DE") sicher größer als der zwischen einem bayrischen und einem österreichischem, was die Unterscheidung zwischen "de-DE" und "de-AT" auch wenig sinnvoll erscheinen lässt.

            Qapla'

            * Irgendwo hab ich letztens gelesen, dass auch „Spass“ für „Spaß“ erlaubt ist, weil einige es mit kurzem [a] aussprechen. Brr…

            --
            Bildung lässt sich nicht downloaden. (Günther Jauch)
        2. Hi!

          Man gibt ja auch keinen obskuren Dialekt an, wenn man „an Weihnachten“ statt „zu Weihnachten“ […] schreibt.

          Weder „an“ noch „zu“ werden vor Weinachten oder Ostern benötigt. Vor Wochentagen – was eine grammatisch gleichwertige Zeitangabe ist – braucht man auch keine solche Spezifikation – obwohl man dafür auch gern ein „am“ davorsetzt.

          Lo!

  4. @@Achim:

    nuqneH

    Hier ein Beispiel: http://www.spruecheportal.de/saint-exupery.php - mit Fehlern
    und hier: http://www.spruecheportal.de/nietzsche.php keine.

    Wahrscheinlich habe ich irgendetwas übersehen, oder?

    Ja, Verweise einzubinden.

    http://www.spruecheportal.de/saint-exupery.php | http://www.spruecheportal.de/nietzsche.php

    Qapla'

    --
    Bildung lässt sich nicht downloaden. (Günther Jauch)