Sven: Content-Type auf UTF-8 - Umlaute??

Hallo ihr,

wenn ich den Content-Type auf UTF8 setze:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung &uuml; für ü usw. nötig?

Lg
Sven

  1. Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung &uuml; für ü usw. nötig?

    Sie ist so gut wie überhaupt nicht nötig.

    Struppi.

  2. Hallo,

    wenn ich den Content-Type auf UTF8 setze:
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">

    Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung &uuml; für ü usw. nötig?

    Die kannst Du auch bei Verwendung von iso-8859-1 direkt in den Quellcode schreiben. Denn das ist Sinn und Zweck der Charset-Angaben. Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.

    Viele Grüße
    Carsten

    --
    Doctype-Switch? Quirks Mode? Standards Mode? Was is'n das?

    1. Hello out there!

      Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung &uuml; für ü usw. nötig?

      Die kannst Du auch bei Verwendung von iso-8859-1 direkt in den Quellcode schreiben.

      Bis hierhin korrekt. [QA-ESCAPES]

      Denn das ist Sinn und Zweck der Charset-Angaben.

      Welche falsch benannt sind: 'Charset' gibt _nicht_ den Zeichensatz an, sondern die Zeichencodierung. In der XML-Deklaration heißt es richtig 'encoding'.

      Es entstehen immer wieder Verständnisprobleme dadurch, dass Zeichensatz und Zeichencodierung nicht unterschieden werden. [TUTORIAL-CHAR-ENC]

      Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.

      Diese Aussage ist völlig falsch. Vermutlich durch falsch gebrauchte Begriffe.

      Eine Zeichencodierung ist immer erforderlich. Man kann niemals Zeichen verwenden, die im verwendeten Zeichensatz nicht vorkommen.

      Meintest du vielleicht: Zeichenreferenzen (numerische oder Entities) sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* in der verwendeten Codierung vorkommen?

      See ya up the road,
      Gunnar

      -- „Und [dieses Forum] soll […] auch ein Fachforum bleiben und kein Psychologieforum werden.“ (Kirsten Evers)
      1. Hallo Gunnar,

        Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.

        Diese Aussage ist völlig falsch. Vermutlich durch falsch gebrauchte Begriffe.

        Eine Zeichencodierung ist immer erforderlich. Man kann niemals Zeichen verwenden, die im verwendeten Zeichensatz nicht vorkommen.

        Meintest du vielleicht: Zeichenreferenzen (numerische oder Entities) sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* in der verwendeten Codierung vorkommen?

        Genau so meinte ich es. Jedesmal, wenn ich denke, ich habe die Geschichte mit Zeichensatz und Zeichenkodierung endlich mal begriffen, werde ich wieder eines besseren belehrt. Ich hoffe, ich blicke es irgendwann doch noch einmal ... ;-)

        Viele Grüße
        Carsten

        --
        Doctype-Switch? Quirks Mode? Standards Mode? Was is'n das?

        1. echo $begrüßung;

          Jedesmal, wenn ich denke, ich habe die Geschichte mit Zeichensatz und Zeichenkodierung endlich mal begriffen, werde ich wieder eines besseren belehrt. Ich hoffe, ich blicke es irgendwann doch noch einmal ... ;-)

          Soll ich es mal in meinen Worten zu beschreiben versuchen?

          Ein Zeichensatz ist erst einmal nichts weiter als eine Ansammlung von Zeichen. Als Beispiel verwende ich die 4 Spielkartensymbole ♣(Kreuz), ♠(Pik), ♥(Herz) und ♦(Karo) und gebe dem Zeichensatz den Namen "Kartenfarben".

          Alle 4 Symbole treten in einer bestimmten Reihenfolge auf, aufgrund ihrer Wertigkeit beim Kartenspielen. In dieser Reihenfolge nummeriere ich sie mal durch: ♣ bekommt die 0, ♠ die 1, ♥ die 2 und ♦ die 3. Die Nummern sind abstrakt anzusehen. Mit einem konkreten Wert in einem bestimmten Dokumentenformat haben sie zunächst nichts zu tun. Verglichen mit Unicode sind diese Nummern die Code Points. Damit haben wir einen kodierten Zeichensatz (coded character set), den ich "Kartenfarbencode" nenne.

          Nun will man diese Zeichen in einem Dokument angeben oder auch irgendwohin übertragen (z.B. in akustischer Form). Üblicherweise nimmt man für das Dokument eine Aneinanderreihung von Bytes. Wir müssen also die Codepoint-Werte in Byte-Werte umkodieren.

          Farbe | Codepoint | Bytewert
          ------+-----------+---------
             ♣  |     0     |    00
             ♠  |     1     |    01
             ♥  |     2     |    02
             ♦  |     3     |    03

          Somit haben wir eine Zeichenkodierung, eine Zuordnung von Zeichen zu einem bestimmten Bytewert. Als Namen vergebe ich KTF-8 (Kartenfarben-Transformations-Format mit 8 Bit).

          Auch andere Kodierungen wären möglich, beispielsweise KTF-2 (2 Bit)

          Farbe | Codepoint | KTF-2-Wert
          ------+-----------+---------
             ♣  |     0     |    00
             ♠  |     1     |    01
             ♥  |     2     |    10
             ♦  |     3     |    11

          oder KTF-M (Morse(ähnlicher) Code) zur Übertragung in akustischer Form.

          Farbe | Codepoint | KTF-2-Wert
          ------+-----------+---------
             ♣  |     0     |    ·
             ♠  |     1     |   --·
             ♥  |     2     |   ·-·
             ♦  |     3     |   ···

          Damit diese Zeichen auch auf einen Bildschirm angezeigt werden können, brauchen wir Abbildungen. Hier wären das vier Bilder, zusammengefasst in einer Font-Datei. Nun kann man diese Symbole auch noch verschieden darstellen, verschnörkelt und bunt, einfarbig und glatt, französisch oder deutsch, und somit ergeben sich dann die Schriftarten.

          echo "$verabschiedung $name";

          1. Hallo,

            ich danke Dir. Ich denke, daß ich es jetzt halbwegs verstehe. Aber wie soll man das Ganze anständig begreifen, wenn selbst die, die es eigentlich besser wissen müßten, dem Ganzen falsche Namen geben ...? ;-)

            Viele Grüße
            Carsten

            --
            Doctype-Switch? Quirks Mode? Standards Mode? Was is'n das?

      2. Hallo Gunnar,

        Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.

        Eine Zeichencodierung ist immer erforderlich. Man kann niemals Zeichen verwenden, die im verwendeten Zeichensatz nicht vorkommen.

        Wollen kann man es aber trotzdem ;-)

        Schöne Grüße,

        Johannes

  3. Hallo

    wenn ich den Content-Type auf UTF8 setze:
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">

    Dieser Eintrag nutzt nichts. Bei XHTML brauchts du eigentlich als allererste Zeile die Zeile "<?xml version='1.0' encoding='utf-8' standalone='no'?>" und bei HTML 4.1 weiß ich zur Zeit nicht, wie es geht.

    Meine Zusammenfassung zu utf-8 habe ich hier. Es ist ein Flash-Film und ca. 1 MB. "XP-Multilanguage-Support.swf"

    Der erste Teil ist wahrscheinlich langweilig, die wichtigen Infos stehen am Schluss.

    Herzliche Grüße
    Wolfgang

    1. Hallo Wolfgang,

      Dieser Eintrag nutzt nichts. Bei XHTML brauchts du eigentlich als allererste Zeile die Zeile "<?xml version='1.0' encoding='utf-8' standalone='no'?>"

      Nein, wenn das Dokument als XML versendet wird, ist UTF-8 eh der Standard, und sonst hat vermulich der "Content-Type"-Header Relevanz, den man (hoffentlich) auf dem Server konfigurieren kann.

      Jonathan

      -- Selfcode: ie:( fl:{ br:> va:) ls:& fo:) rl:? ss:} de:> js:| ch:? mo:} zu:)