Hi,
"<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />"
Der Character-Set. UTF-8 ist ein Character Set und ISO-8859-1 auch.
Nein, kein Character Set. Sondern eine Kodierung.
Ich versteh nicht, warum die Angabe den Namen charset bekommen hat - denn es ist eben NICHT der Zeichensatz.
(beim XML-Prolog hat man den Fehler endlich korrigiert, dort heißt es korrekt "encoding").
Sowohl bei HTML als auch bei XML ist der Zeichensatz immer ISO10646 (auch als Unicode bekannt), egal, welche Kodierung benutzt wird, siehe z.B. http://www.w3.org/TR/html401/intro/intro.html#h-2.3.1:
One important step has been the adoption of the ISO/IEC:10646 standard (see [ISO10646]) as the document character set for HTML.
UTF-8 oder auch UTF-16 sind nur bestimmte Kodierungen dieses Zeichensatzes, die beide erlauben, alle Zeichen ohne numerische Zeichenreferenzen ( ) oder Zeichen-Entitäten (â¬) zu benutzen.
Die ISO-Kodierungen erlauben jeweils nur, einen kleinen Ausschnitt aus dem Zeichensatz ohne Zeichenreferenten/Zeichen-Entitäten zu benutzen, alle restlichen Zeichen müssen über diese Hilfsmittel angesprochen werden.
Gleiches gilt auch für Windows-1252 und noch ein paar andere.
Bei den ISO-Teilen kann man zur Not noch von einem Character Set sprechen (es legt ja eine gewisse Menge an Zeichen fest).
Bei den UTF-Teilen ist das aber nicht der Fall - hier wird lediglich festgelegt, wie ein Zeichen kodiert wird, aber nicht, welche Zeichen es gibt - dies ist Aufgabe von Unicode.
cu,
Andreas
MudGuard? Siehe http://www.Mud-Guard.de/