Thomas Mell: Meta-Tags HTML-encoden?

Beitrag lesen

Hallo,

muss man die Inhalte von Meta-Tags HTML-encoden (z.B. ü=ü)? Ich konnte darüber nirgends eine klare Aussage finden.

Es kommt ganz drauf an mit welcher Zeichensatzkodierung dein Dokument verarbeitet wird. Deutsche Umlaute sind (soweit mir bekannt) nur bei ISO-8859-1 erlaubt.
Prinzipiell bestimmt die Zeichensatzkodierung, welche Zeichen in einem Dokument erlaubt sind, egal ob diese in Meta-Tags oder sonst wo stehen (außer Tag/Attributnamen).
In UTF-8 werden Umlaute in 2 Byte umgewandelt (ein Zeichen kann in UTF-8 bis zu 4 Byte beanspruchen), dort haben Umlaute im Klartext nichts verloren.
Um bei Deinem Beispiel zu bleiben; ein ü besteht in UTF-8 aus den beiden Bytes HEX(C3 BC).
Folgende Möglichkeiten hast du nun:
1. Du kodierst Dein Dokument in ISO-8859-1 und darfst das ü in Klartext schreiben.
2. Bei UTF-8 musst Du HEX(C3 BC) schreiben.
3. In beiden Fällen kannst Du auch das Entity ü benutzen.

Entities sind unabhängig von der verwendeten Zeichensatzkodierung, da in [X]HTML spezifiziert (fest eingebaut).
Einer Suchmaschine ist es egal welche der Möglichkeiten Du benutzt. Intern wandelt z.B. Google zuerst alles nach UTF-8 um und vergleicht dann. Deshalb ist dort ein ü in ISO-8859-1 das Selbe wie ein ü oder HEX(C3 BC) in UTF-8.

Viele Grüße
Thomas Mell

http://www.validome.org