suit: Nichtvalider Code bei imagemap

Beitrag lesen

Einen HTML5-Parser zu schreiben ist auch nicht schwieriger als einen XML-Parser zu schreiben.

HTML5 hat aber weder etwas mit XML noch mit SGML zu tun - es sieht nur so aus und hat völlig eigene Regeln.

Bei HTML5 hat man an allen Ecken und Enden das gefühl, dass Hixie schlechtes Zeug raucht und sich irgendwas aus den Fingern saugt. Sollte HTML5 nicht etwas sein, dass das derzeitige Web abbildet? Wie kommen dann so Geschichten wie die cite-Sache zustande wo man nicht auf die Community hört und sein eigenes Ding durchzieht?

Der genannte Fall ist mir nicht bekannt, daher kann ich dazu nichts sagen.

http://wiki.whatwg.org/wiki/Cite_element

Ich gebe zu, meine Kenntnis über SGML ist nicht sehr groß, aber die Autoren von HTML hätten sicher die Möglichkeit gehabt, derlei Späße einzuschränken. Vor allem, da bereits feststand, dass es keine echten SGML-Parser gibt.

Zu der Zeit als TBL HTML geschaffen hat, gab es noch keien Browser wie wir sie heute kennen - das kam erst später, als das Web zum Massenmedium wurde und jeder HTML schreiben könnte. Und da es auch damals schon um Marktanteile ging, konnte der Browser der "den Mist der Autoren" am schönsten anzeigt natürlich gewinnen.

Hätte es SGML-Parser gegeben, dann hätte XHTML vermutlich gar keinen Aufschwung erleben können. Von daher hatte die ganze Problematik ja auch ihre Vorteile, nicht?

Sicher - aber mit HTML5 geht das eben wieder in die Gegenrichtung. Anstatt zu spezifizieren wie es sein soll und sich daran zu halten (no matter what) wird eine Regel geschafft, die beschreibt wie es sein soll, wenn es nicht so ist wie es sein soll, damit jeder "Depp ohne Ahnung" eine Website erstellen kann - womit wir wieder beim oberen Punkt sind: Marktanteile und potentielle Kunden. Das ist es was Google vornehmlich interessiert. Dass Chrome und Firefox beides Google-Browser sind, sollte klar sein.

Mehr Websites von Hobby-Autoren = mehr Werbeplatz für AdSense und somit AdWords-Kunden.

Und jetzt komm mir keiner mit Verschwörung :)

Die Bugs sind nicht das Problem. Das Problem ist eher, dass man sich nicht traut (oder das Web es unmöglich macht - oder beides) ein paar der vorhandenen Regeln zu lockern.

Oder eben zu straffen: wenn es HTML-Fehler gibt, soll der Browser eine Fehlermeldung ausspucken, gerne auch nur in der Fehlerkonsole.

CSS- oder JavaScript-Fehler bemeckert jeder Browser, aber HTML ist wurst.

Welchen Vorteil hat dann das Nutzen von XHTML.

Die Weiterverarbeitung als XML, wenn es ein XML-fähiger Agent es haben will (über die Accept-Header steuerbar).

In vorliegenden Fall ist das aber nicht möglich, weil application/xhtml+xml zu einer Fehlermeldung führen würde. Das Theme über Rebell ist ein fertiges Theme und an den Updates daran bin ich nicht primär schuld - da wäre es dämlich, das ganze als XML verarbeiten lassen zu wollen, weil die gefahr besteht, dass jemand ohne Ahnung reinfingert und dann nichts mehr geht :)

Was wäre, wenn ein XML-Parser ohne Kenntnis des Medientyps das Dokument verarbeitet?

Fehlermeldung :)

Wenn das Dokument aber valide ist, kann man es ohne Probleme mit einem XML-Parser verarbeiten. Und das ist ein extremer Vorteil, besonders wenn es darum geht Informationen zu extrahieren, die man anderswo braucht.