Diese Sache ist ja gerade das, was für mich unverständlich ist. Jetzt schon kann kaum jemand ein halbwegs ordentlich semantisch nachvollziehbares Dokument verfassen
Nein, kann man nicht. Es ist nicht möglich, Abschnitte semantisch zu kennzeichnen. Es gibt Überschriften, klar. Die kennzeichnen die jeweils folgenden Inhalte. Das Modell von Sections ist da natürlich komplizierter, letztlich aber weitaus mächtiger und semantischer.
HTML5 stellt zusätzlich eine vordefinierte Semantik bereit die kaum jemand versteht, wenn er die Spezifikation nicht genau liest.
Semantikdiskussionen gab es vor zehn Jahren schon und wird es immer geben. Man denke nur an abbr vs. acronym. Auch die neuen HTML5-Elemente bedürfen einer Erläuterung. Einfach und selbsterklärend ist das alles nicht. Sinnvolles HTML ist nicht einfach. Ich persönlich würde das aber auch nicht erwarten.
Zwar begrüße ich, dass HTML5 semantischer wird, aber die Grundidee dahinter, dass eine Maschine aufgrund der Auszeichnung den Inhalt zerlegen kann (Outlining) ist imho von vorne herrein zum Scheitern verurteilt.
Die Möglichkeit der automatisierten Verarbeitung war und ist die Grundlage von HTML. Suchmaschinen und Screenreader sind wohl die wichtigsten UAs, die massiv auf Outlining basieren.
Das halte ich für ein Gerücht - zwar ist das Outlining hier wichtig, aber die Struktur der Dokumente ist Google sicher herzlich egal. Ob du da <font size="5"> oder <h2> notierst ist denen egal, die finden die Inhalte schon auch wenn sie nicht vernünftig ausgezeichnet oder hochgradig invalide (mit Verschachtelungsfehlern) sind. Das müssen sie eben auch, weil der Großteil der vorhandenen Dokumente nicht sinnvoll ausgezeichnet ist oder ungükltig ist.
Das heißt ja nicht, dass HTML nicht definieren sollte, wie man es richtig macht, denn richtig angewandt ist der Nutzwert sehr hoch.
Das streite ich auch nicht ab - nur ist mittlerweile HTML5 in dieser hinsicht so "kompliziert", dass es die die es bei HTML 4.01 schon falsch machen ohnehin wieder falsch machen werden und die Gefahr aufgrund der genannten Verwirrungen hinsichtlich Benennung auch andere falsch machen werden.
Der Sinn dahinter wäre - soweit ich das verstanden habe - dass man sich redundanten geschichten wie etwa RSS sparen kann, da man im HTML-Dokument ja schon alles ordentlich und logisch auszeichnen kann - aber dass das fruchtet bezweifle ich.
Jein. HTML5 ist ja nicht gleich hAtom oder Microdata. Atom und andere Syndication-Formate verfolgen noch einmal einen anderen Ansatz als HTML. Klar, man kann so etwas wie Syndication auch mit HTML5 machen, wenn ein Blog ordentlich mit article und Co. ausgezeichnet ist. Die Anwendungsfälle sind da aber noch etwas anders gelagert.
Sicher - aber ein ordentlich ausgezeichneter News- oder Artikelbereich auf einer statischen Seite kann dadurch auch ohne RSS-Feed als solcher identifiziert und ordentlich weiterverarbeitet werden ohne dass man jetzt gleich per Hand zweigleisig fahren müsste und einen RSS-Feed ebenfalls noch aktuell halten muss.