Tim Tepaße: HTML 5? XHTML 5?

Beitrag lesen

Der HTML-5-Validator ist m.W. Feature-complete. Er wird sein Leben lang dabei bleiben, schlechte Tag-Soup gutzuheißen, weil HTML 5 kompatibel mit HTML 4 ist. Zwar nicht hinsichtlich der grausigsten SGML-Features wie SHORTTAG, aber z.B. hinsichtlich der vielen optionalen Tags [..]
Da kann man nicht zwischen absichtlich weggelassenem oder versehentlich vergessenem End-Tag unterscheiden.

Effektiv wird ein versehentlich weggelassenes End-Tag doch nur relevant, wenn es nicht optional ist – die einzig gemessene Qualität ist dann die Qualität der geringeren kognitiven Last für Quelltext-Entwickler, nicht die technische Unwägbarkeit. Denn die existiert im Prinzip nicht; ist doch die Optionalität und die Selbstschließung von Tags definiert, es gibt ein Verarbeitungsmodell dafür. Zugegeben, ein sehr komplexes Verarbeitungsmodell, aber es gibt eines. Ich tue mich dann schwer, das noch als Tag Soup zu bezeichnen; ich erkenne aber wohl an, dass das ein wesentliches Problem des Authoring ist.

Es ginge höchstens, auch bei HTML 5 ein duales Modell zu etablieren: Auslieferung in der HTML-5-Serialisierung, aber XHTML-5-artige Syntax. Dann braucht man nur den HTML-5-Doctype entfernen und kann den Code als XHTML 5 mit Relax NG und Schematron validieren. Da das aber niemand tun wird und kein Tool das anbieten wird [..]

Soweit ich weiß, braucht man noch nicht mal den Doctype zu entfernen. Im Prinzip kann man also ein Anhang-C-artiges Modell nutzen, XHTML-5-Syntax und Auslieferung als text/html. Nebenbei: Es gibt Tools, die XHTML-Syntax nutzen und HTML-Syntax ausspucken. Das von mir sehr gemochte Template-System Genshi arbeitet z.B. nicht auf Text-Ebene sondern auf einer logischen Markup-Stream-Ebene. Dort könnte man z.B Templates in XHTML-5-Syntax nutzen, die in HTML-5-Syntax serialisiert werden. Ich meine, sogar mal einen HTML-5-Serialisierer für Genshi gesehen zu haben, der sämtliche Optionalität ausnutzt, also z.B. <p class=foo>bar<p class=baz>-artigen Quellcode ausspuckt. Das wäre aber eine extremere Lösung.

Postel's Law war einmal. Dafür stand m.M.n. XHTML 1 (überprüfbar »conservative« auf der Autorenseite, »liberal« auf der Verarbeitungsseite).

Häh? Die drakonische Fehlerverarbeitung von XML ist doch ein wesentlicher Verstoß gegen das Gebot der Liberalität der Verarbeitung. Oder redest Du von Anhang-C-XHTML?