Hallo,
Ich sagte bereits, dass die Dateiendung .html dazu führt, dass der Server den Inhalt als text/html deklariert (HTTP-Header »Content-Type: text/html«).
Ich meine mich erinnern zu können, im HTTP-RFC gelesen zu haben
Höchstens unter http://www.w3.org/TR/html401/struct/global.html#adef-http-equiv steht entsprechendes.
daß der Webserver auch die Dateien scannen könnte und die http-equiv-Angabe im Kopf zum Bestimmen des MIME-Typus verwenden kann. Allerdings Standards und die Realität. ;-)
Klar, aber was sollte man da schon abweichend hineinschreiben, was gleichzeitig kohärent wäre? Was auch immer, es fiele aus dem Rahmen. Es gibt letztlich nur diesem Medientyp, der für HTML geeignet ist. Die Abbildung von Webtechnik auf Medientyp und umgekehrt, hier HTML auf text/html und text/html auf HTML (plus XHTML 1.0 nach den Kompatibilitätsrichtlinien) gemäß RFC 2854, ist in diesem Fall insofern eindeutig, als es keine sinnigen weiteren Medientypen gibt, die sich speziell zur Kennzeichnung von HTML eignen.
Im Übrigen wäre auch dies widersinnig: Der Webserver wüsste also, dass er es mit HTML zu tun hat, und parst es entsprechend, um einen meta-Tag mit http-equiv="Content-Type" zu finden. Im meta-Tag stünde dann, dass das grade geparste HTML-Dokument gar kein HTML ist, sondern beispielsweise text/plain. Das wäre z.B. dann sinnig, wenn eine .html-Datei als Quelltext angezeigt werden soll. Doch dann würde der Quelltext von sich behaupten, er sei der »Quelltext« eines text/plain-Dokuments, insofern will man das nicht wirklich.
Wenn ein Webserver also HTML-Dokument parst, dann wäre dies, soweit ich es beurteilen kann, nur sinnvoll, um die charset-Angabe aus dem besagten meta-Tag zu extrahieren, um diese dann auch im entsprechenden HTTP-Header aufzuführen.
Mathias