Content-Type auf UTF-8 - Umlaute?? von CarstenP, 10.10.2007 12:33

SELF-Forum

Content-Type auf UTF-8 - Umlaute??

Sven 10.10.2007 12:28

html

– Informationen zu den Bewertungsregeln

Hallo ihr,

wenn ich den Content-Type auf UTF8 setze:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung ü für ü usw. nötig?

Lg
Sven

Beitrag melden

– Informationen zu den Bewertungsregeln

Content-Type auf UTF-8 - Umlaute??
Struppi Homepage des Autors 10.10.2007 12:33

html
– Informationen zu den Bewertungsregeln
Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung ü für ü usw. nötig?

Sie ist so gut wie überhaupt nicht nötig.

Struppi.
Beitrag melden

–
Informationen zu den Bewertungsregeln
Content-Type auf UTF-8 - Umlaute??
CarstenP Homepage des Autors 10.10.2007 12:33

html
+1 Informationen zu den Bewertungsregeln
Hallo,

wenn ich den Content-Type auf UTF8 setze:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung ü für ü usw. nötig?

Die kannst Du auch bei Verwendung von iso-8859-1 direkt in den Quellcode schreiben. Denn das ist Sinn und Zweck der Charset-Angaben. Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.

Viele Grüße
Carsten

--
Doctype-Switch? Quirks Mode? Standards Mode? Was is'n das?
Beitrag melden

+1
Informationen zu den Bewertungsregeln
1. Content-Type auf UTF-8 - Umlaute??
  
  Gunnar Bittersmann Homepage des Autors 10.10.2007 16:00
  
  html
  +2 Informationen zu den Bewertungsregeln
  Hello out there!
  
  Kann ich dann Umlaute im Klartext in den Quelltext schreiben, oder ist weiterhin die Umschreibung ü für ü usw. nötig?
  
  Die kannst Du auch bei Verwendung von iso-8859-1 direkt in den Quellcode schreiben.
  
  Bis hierhin korrekt. [QA-ESCAPES]
  
  Denn das ist Sinn und Zweck der Charset-Angaben.
  
  Welche falsch benannt sind: 'Charset' gibt _nicht_ den Zeichensatz an, sondern die Zeichencodierung. In der XML-Deklaration heißt es richtig 'encoding'.
  
  Es entstehen immer wieder Verständnisprobleme dadurch, dass Zeichensatz und Zeichencodierung nicht unterschieden werden. [TUTORIAL-CHAR-ENC]
  
  Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.
  
  Diese Aussage ist völlig falsch. Vermutlich durch falsch gebrauchte Begriffe.
  
  Eine Zeichencodierung ist immer erforderlich. Man kann niemals Zeichen verwenden, die im verwendeten Zeichensatz nicht vorkommen.
  
  Meintest du vielleicht: Zeichenreferenzen (numerische oder Entities) sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* in der verwendeten Codierung vorkommen?
  
  See ya up the road,
  Gunnar
  
  --
  „Und [dieses Forum] soll […] auch ein Fachforum bleiben und kein Psychologieforum werden.“ (Kirsten Evers)
  Beitrag melden
  
  +2
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. Content-Type auf UTF-8 - Umlaute??
    
    CarstenP Homepage des Autors 10.10.2007 17:09
    
    html
    
    – Informationen zu den Bewertungsregeln
    Hallo Gunnar,
    
    Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.
    
    Diese Aussage ist völlig falsch. Vermutlich durch falsch gebrauchte Begriffe.
    
    Eine Zeichencodierung ist immer erforderlich. Man kann niemals Zeichen verwenden, die im verwendeten Zeichensatz nicht vorkommen.
    
    Meintest du vielleicht: Zeichenreferenzen (numerische oder Entities) sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* in der verwendeten Codierung vorkommen?
    
    Genau so meinte ich es. Jedesmal, wenn ich denke, ich habe die Geschichte mit Zeichensatz und Zeichenkodierung endlich mal begriffen, werde ich wieder eines besseren belehrt. Ich hoffe, ich blicke es irgendwann doch noch einmal ... ;-)
    
    Viele Grüße
    Carsten
    
    --
    Doctype-Switch? Quirks Mode? Standards Mode? Was is'n das?
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
    1. Zeichensatz und Zeichenkodierung
      
      dedlfix 10.10.2007 19:37
      
      html
      
      +4 Informationen zu den Bewertungsregeln
      
      echo $begrüßung;
      
      Jedesmal, wenn ich denke, ich habe die Geschichte mit Zeichensatz und Zeichenkodierung endlich mal begriffen, werde ich wieder eines besseren belehrt. Ich hoffe, ich blicke es irgendwann doch noch einmal ... ;-)
      
      Soll ich es mal in meinen Worten zu beschreiben versuchen?
      
      Ein Zeichensatz ist erst einmal nichts weiter als eine Ansammlung von Zeichen. Als Beispiel verwende ich die 4 Spielkartensymbole ♣(Kreuz), ♠(Pik), ♥(Herz) und ♦(Karo) und gebe dem Zeichensatz den Namen "Kartenfarben".
      
      Alle 4 Symbole treten in einer bestimmten Reihenfolge auf, aufgrund ihrer Wertigkeit beim Kartenspielen. In dieser Reihenfolge nummeriere ich sie mal durch: ♣ bekommt die 0, ♠ die 1, ♥ die 2 und ♦ die 3. Die Nummern sind abstrakt anzusehen. Mit einem konkreten Wert in einem bestimmten Dokumentenformat haben sie zunächst nichts zu tun. Verglichen mit Unicode sind diese Nummern die Code Points. Damit haben wir einen kodierten Zeichensatz (coded character set), den ich "Kartenfarbencode" nenne.
      
      Nun will man diese Zeichen in einem Dokument angeben oder auch irgendwohin übertragen (z.B. in akustischer Form). Üblicherweise nimmt man für das Dokument eine Aneinanderreihung von Bytes. Wir müssen also die Codepoint-Werte in Byte-Werte umkodieren.
      
      Farbe | Codepoint | Bytewert
      ------+-----------+---------
         ♣  |     0     |    00
         ♠  |     1     |    01
         ♥  |     2     |    02
         ♦  |     3     |    03
      
      Somit haben wir eine Zeichenkodierung, eine Zuordnung von Zeichen zu einem bestimmten Bytewert. Als Namen vergebe ich KTF-8 (Kartenfarben-Transformations-Format mit 8 Bit).
      
      Auch andere Kodierungen wären möglich, beispielsweise KTF-2 (2 Bit)
      
      Farbe | Codepoint | KTF-2-Wert
      ------+-----------+---------
         ♣  |     0     |    00
         ♠  |     1     |    01
         ♥  |     2     |    10
         ♦  |     3     |    11
      
      oder KTF-M (Morse(ähnlicher) Code) zur Übertragung in akustischer Form.
      
      Farbe | Codepoint | KTF-2-Wert
      ------+-----------+---------
         ♣  |     0     |    ·
         ♠  |     1     |   --·
         ♥  |     2     |   ·-·
         ♦  |     3     |   ···
      
      Damit diese Zeichen auch auf einen Bildschirm angezeigt werden können, brauchen wir Abbildungen. Hier wären das vier Bilder, zusammengefasst in einer Font-Datei. Nun kann man diese Symbole auch noch verschieden darstellen, verschnörkelt und bunt, einfarbig und glatt, französisch oder deutsch, und somit ergeben sich dann die Schriftarten.
      
      echo "$verabschiedung $name";
      
      Beitrag melden
      
      +4
      Informationen zu den Bewertungsregeln
      
      Übersicht
      
      alle Foren
      
      SELFHTML-Forum
      
      anmelden
      
      Benutzerkonto erstellen
      
      Beitrag im Thread-Baum
      1. Zeichensatz und Zeichenkodierung
        
        CarstenP Homepage des Autors 12.10.2007 12:32
        
        html
        
        – Informationen zu den Bewertungsregeln
        
        Hallo,
        
        ich danke Dir. Ich denke, daß ich es jetzt halbwegs verstehe. Aber wie soll man das Ganze anständig begreifen, wenn selbst die, die es eigentlich besser wissen müßten, dem Ganzen falsche Namen geben ...? ;-)
        
        Viele Grüße
        Carsten
        
        --
        Doctype-Switch? Quirks Mode? Standards Mode? Was is'n das?
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
  2. Content-Type auf UTF-8 - Umlaute??
    
    Johannes Zeller Homepage des Autors 10.10.2007 17:20
    
    html
    
    – Informationen zu den Bewertungsregeln
    Hallo Gunnar,
    
    Codierungen sind nur dann erforderlich, wenn Du Zeichen verwenden willst, die *nicht* im verwendeten Charset vorkommen.
    
    Eine Zeichencodierung ist immer erforderlich. Man kann niemals Zeichen verwenden, die im verwendeten Zeichensatz nicht vorkommen.
    
    Wollen kann man es aber trotzdem ;-)
    
    Schöne Grüße,
    
    Johannes
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
Content-Type auf UTF-8 - Umlaute??
Wolfgang 10.10.2007 14:48

html
– Informationen zu den Bewertungsregeln
Hallo

wenn ich den Content-Type auf UTF8 setze:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

Dieser Eintrag nutzt nichts. Bei XHTML brauchts du eigentlich als allererste Zeile die Zeile "<?xml version='1.0' encoding='utf-8' standalone='no'?>" und bei HTML 4.1 weiß ich zur Zeit nicht, wie es geht.

Meine Zusammenfassung zu utf-8 habe ich hier. Es ist ein Flash-Film und ca. 1 MB. "XP-Multilanguage-Support.swf"

Der erste Teil ist wahrscheinlich langweilig, die wichtigen Infos stehen am Schluss.

Herzliche Grüße
Wolfgang
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. Content-Type auf UTF-8 - Umlaute??
  
  Jonathan 10.10.2007 16:04
  
  html
  – Informationen zu den Bewertungsregeln
  Hallo Wolfgang,
  
  Dieser Eintrag nutzt nichts. Bei XHTML brauchts du eigentlich als allererste Zeile die Zeile "<?xml version='1.0' encoding='utf-8' standalone='no'?>"
  
  Nein, wenn das Dokument als XML versendet wird, ist UTF-8 eh der Standard, und sonst hat vermulich der "Content-Type"-Header Relevanz, den man (hoffentlich) auf dem Server konfigurieren kann.
  
  Jonathan
  
  --
  Selfcode: ie:( fl:{ br:> va:) ls:& fo:) rl:? ss:} de:> js:| ch:? mo:} zu:)
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Sven: Content-Type auf UTF-8 - Umlaute??

Content-Type auf UTF-8 - Umlaute??

Zeichensatz und Zeichenkodierung

Content-Type auf UTF-8 - Umlaute??

Content-Type auf UTF-8 - Umlaute??

Content-Type auf UTF-8 - Umlaute??

Content-Type auf UTF-8 - Umlaute??

Content-Type auf UTF-8 - Umlaute??

Zeichensatz und Zeichenkodierung

Zeichensatz und Zeichenkodierung

Content-Type auf UTF-8 - Umlaute??

Content-Type auf UTF-8 - Umlaute??

Content-Type auf UTF-8 - Umlaute??