Den HTML-Autor sollte es nicht einmal interessieren, ob sich hinter der Ressource http://example.com/logo ein animiertes GIF oder ein Flash-Filmchen verbirgt. Und schon gar nicht, was der Browser anstellt, um die Animation darzustellen.
Freilich gibt es viele Fälle, wo ich einfach nur die URI angeben könnte und den Rest dem Browser überlassen kann. Da mag eine solche Vereinfachung und Zentralisierung seinen Sinn haben. Das haut bei dem Beispiel hin, wenn man den Flash-Player wie bloße passive Darstellungsmodule wie libpng und Co. betrachtet. Nun ist ein Flash aber nicht bloß eine stumpfe Animation, sondern oftmals eine eigene Anwendung. Und noch weniger ist ein Video etwas, dessen Abspielen der Autor nicht steuern will. Was XHTML 2 nicht bedenkt bzw. kategorisch in DOM-Standards auslagern wollte, ist eben diese Schnittstelle zwischen den an der Dokumentdarstellung beteiligten Ressourcen. Natürlich nimmt HTML 5 ebenso eine einseitige Position ein, es geht vornehmlich um HTML-Dokumente als »Applications«.
AFAIS scheint sich HTML 5 darauf zu konzentrieren, es Browsern leichter zu machen (stecken ja auch Browserentwickler dahinter).
Das ist die Philosophie der Abwärtskompatibilität, die keine von Grund auf neue Sprache designt.
Ein Webseitenautor soll also mit einem animiertem GIF anders umgehen müssen als mit einem Flash-Filmchen? Anstatt die Technik den Bedürfnissen des Menschen anzupassen, soll sich der Mensch den Bedürfnissen der Technik anpassen?
Ideal ist das sicherlich nicht, weil es einfaches nicht unbedingt einfach macht. Aber es ist bei diesen HTML-Zusätzen qua ihrer Natur nicht möglich, in das bestehende HTML eine saubere Struktur hineinzubringen.
Mathias