Hallo,
Mir stellt sich viel weitergehend die Frage, wozu XHTML überhaupt gut sein soll.
Ich habe diesbezüglich lediglich einen Grauen gegen die unredliche Werbung für XHTML. XHTML ist schön und gut, wenn man es auf simple praktische Vorteile wie die Schlüssigkeit und Konsequenz der Syntax usw. herunterbricht.
Sobald man aber Webautoren von irgendwelchen genuinen Vorteilen von XHTML als XML überzeugen will, so bricht meist alles in sich zusammen. Die Praxis zeigt, dass das wirklich nur Luftschlösser sind. Wer HTML 4 beherrscht und keinen konkreten Nutzen in diesen eigentümlichen Vorteilen sieht, soll um Himmels Willen nicht dem XHTML-Hype verfallen, der momentan sowieso größtenteils fehlerhafte Dokumente erzeugt, die wenig mit XML zu schaffen haben.
Stellt sich wirklich jemand vor, ein XHTML-Dokument irgendwann mal als XML-Datenquelle zu benutzen und Daten aus diesem Dokument zu ziehen?
Zumindest wird das immer als potenzieller Vorteil von XHTML aufgeführt, aber in der Tat wird er selten genutzt. Ich zumindest extrahiere gerne z.B. über das DOM Daten aus statischen XHTML-Dateien, in denen ich Semantik unterbringe. Die Frage ist natürlich, ob es dazu XHTML bedarf. libxml2 z.B. hat auch einen guten HTML-Parser, der prinzipiell genauso breit verfügbar ist. Hier bei SELFHTML arbeiten wir letztlich auch mit vielen statischen HTML-4-Seiten, was zumindest nicht diese Art der Verarbeitung behindert.
Wozu? Weil eventuell die eigentliche XML-, Datenbank-, oder irgendwie anders angelegte Datenquelle verloren gegangen ist?
Tatsächlich wird XHTML seltenst als Speicherformat genutzt, man generiert eher XHTML aus eine vielseitigeren Quelle, die relationale Datenbank ist da wohl üblich. Andererseits kann diese Datenbank wiederum XHTML-formatierten Text enthalten, wenn nicht ein eigenes Markup erfunden wurde.
Wenn so, inwiefern erleichtert XHTML dann die Rückgewinnung der Daten? Welcher Unterschied besteht zwischen der Aussagekraft eines Hx, P, TD, UL/LI, OL/LI, EM, STRONG ... - Elementes aus XHTML gegenüber einem ebensolchen aus HTML?
XHTML erleichtert die Rückgewinnung insofern, dass ein XML-Parser nahezu überall in jeder Sprache und jeder Umgebung verfügbar ist. Aber wie du auch sagst:
Und nein, das Argument, XHTML zwänge zur korrekten Tag-Setzung, zieht nicht. Es existieren funktionierende HTML-Tag-Soup-Parser.
Für das Arbeiten mit XML stellen die üblichen Programmierumgebungen meiner Wahrnehmung nach ausgereiftere Techniken zur Verfügung.
Mathias