Beat: utf8 - unicode

Beitrag lesen

Ja. Das sehe ich sofort ein wenn ich
Content-type:text/html; charset=UTF-8
schreibe.

Vielleicht brauche ich ein Lexikon. Aber ich bin in guter Gesellschaft.

ja, auch die Autoren der HTTP-Spec haben es falsch gemacht; das ist bekannt. Kein Grund den Fehler zu wiederholen.

Und die von der MIME-Specification auch...
Nein das hat nichts mit Wiederholung zu tun.

Schau. ich gebe das Charset an, das zum Document gehört.
Das Charset ist hier eine Analogie zur Sprache.
Im Browser kannst du das Encoding (Analogie = Übersetzung) definieren. Das heisst, übersetze Bytes zu Unicode als ob die Sprache so oder so sei.
Ein Document kann sich nicht selbst nach Unicode übersetzen. Es gibt lediglich durch das Charset seine Syntax, seine Sprache an, welche als ein Part in der Übersetzung zu wählen ist. Der andere Part ist die dem programm eigene Idee von Bytes zu Unicode. Ich habe schon gesagt. Perl verwendet zwei Charsets intern. Encoding und Decoding ist die Übersetzung der externen Ressource in diese interne Präsentation.

Ich hoffe das hilft zumindest jenen, die nicht schlauer als die Spec-Autoren sein wollen.

mfg Beat

--
><o(((°>           ><o(((°>
   <°)))o><                     ><o(((°>o
Der Valigator leibt diese Fische