Hallo,
Was heißt eine Seite ist im Unicode Format?
Das die Zeichen, Zahlen und Buchstaben in der Seite nach einem Unicode-Schema (en)codiert sind.
"The Unicode Standard uses 8-bit code units in the UTF-8 encoding form, 16-bit code units in the UTF-16 encoding form, and 32-bit code units in the UTF-32 encoding form"
Das beduetet, dass ein Zeichen in UFT-8 8-bit Länge hat. Wie diese Zeichen an einem Rechner dargestellt werden, ist eine andere Frage.
Ich dachte immer, dass man folgende Zeichansatzgabe macht:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">und dann sämtlicher Text im Quelltext einer html Seite nur hexwerte enthält.
Nein. Die 'normalen' ASCII-Zeichen muss du nicht als hexadezimale Wert angeben. Nur Zeichen die "höher" sind. Bzw. diese auch nur dann, wenn du die Seite nicht im Unicode-Format speicherst.
Z.B. so sieht der deutsche (Quell)Text aus deinem Beispiel aus, wenn die Seite direkt in Unicode-Erzeugt wird:
Wenn der Hahn kräht auf dem Mist,
ändert sich das Wetter,
oder es bleibt wie es ist.
http://yudit.org/cgi-bin/test.cgi
Die Seite kann ich auf meinem Rechner, gerade alle möglichen Zeichensätze unter Win 2000 installiert habe. Aber was hat da mit Unicode zu tun.
Das hat damit zu tun, dass die Seite im Unicode-Format gespeichert bzw. erzeugt ist.
Ob du alles "lesen" kannst hängt aber davon ab ob dein OS unicodefähig ist (win200 ist es) und ob du eine Schriftart installiert hast, die die benötigte Zeichen enthält.
Grüße
Thomas