Mathias Bigge: Logische vs. semantische Auszeichnung

Beitrag lesen

Hi Gunnar,

Ein Beispiel: <h1>Queen Elizabeth II. schlägt Tim Berners-Lee zum Ritter</h1>

Die Kennzeichnung h1 fügt dem Textstück im Kontext der Seite die Bedeutung "besonders wichtig hinzu". Da diese Bedeutung im Browser aber nicht als Text angezeigt wird, setzt dieser dies durch eine bestimmte Formatierung um. Man könnte das Tag also als Aufforderung verstehen, die gekennzeichnete Textpassage in besonderer Weise zu formatieren.

Eben dies wird von den Form-vs.-Inhalt-Adepten aber als falsches Verständnis des Tags und seiner Funktion bezeichnet. Die Formatierung sei allein Sache von CSS.

In gewissem Maße ist das richtig: Welche Formatierung das Tag h1 tatsächlich erzeugt, hängt von vielen Faktoren ab. Nun könnte man etwas offener formulieren.

Das Tag h1 sollte mit einer Formatierung verbunden werden, die den Text
a) fetter und/oder größer als den von h2 usw. und p darstellt
b) ihn alternativ auf andere Weise hervorhebt, die seine besondere Bedeutung für die Seite vermittelt.

Eine konsequente Fortführung der völligen Trennung von Form und Inhalt kann sich damit aber nicht zufrieden geben. Hier müsste es heißen:

Der Tag h1 kennzeichnet einen Textabschnitt "semantisch" als besonders wichtig, kann aber beliebig formatiert werden, etwa in der gleichen Farbe und Größe wie der Fließtext.

Auf der Oberfläche der Website wäre aber dadurch die Bedeutung nicht mehr dargestellt. Die volllständige Trennung von Form und Inhalt bewirkt im Medium Internet also eine Inhaltsentleerung des Tags.

Was dem Form-ohne-Inhalt-Ansatz m.E. fehlt ist ein Bewusstsein über den Zusammenhang von Form und Inhalt, auch in der natürlichen Sprache. Bedeutung vermittelt sich nicht nur durch die Summe lexikalischer Wortbedeutungen im Satz oder Text, sondern wird durch syntaktische Regeln, Textzusammenhänge und Ausdrucksformen gemeinsam bestimmt, im geschriebenen Text wesentlich auch durch Formate.

Was tatsächlich Sinn der Form-und-Inhalt-Debatte sein könnte, wäre es, einen festen Zusammenhang bestimmter Formate mit bestimmten, gleichen Inhalten festzulegen. In der technischen Beschreibung einer Programmiersprache müssten Befehle, Parameter und Syntax in jeweils immer gleicher Weise dargestellt werden. Die Gleichheit bedeutet dabei nicht, dass es immer das gleiche Format sein müsste, sondern dass jedes Sprachelement typisiert werden muss und dass die Einheit dieser Typen durch einheitliche Formate darzustellen wäre.

Nun ist es eine Illusion zu glauben, die dafür verwendbaren Formate seien beliebig, man könne etwa eine Überschrift sinnvoll dadurch kennzeichnen, dass man sie in der gleichen Farbe und Schriftart, aber kleiner formatierte als gewöhnlichen Fließtext. Erfolgreiche grafische Strukturierung von Dokumenten beruht wie jede Kommunikation auf Konventionen und Erwartungen.

Solche Konventionen kennen wir intuitiv alle. Dennoch sind sie wissenschaftlich schwer zu erfassen. Ich nenne mal ein einfaches, altes Beispiel aus dem Bereich der Semantik der natürlichen Sprache: Man hat etwa versucht, die Trennlinie zwischen den Begriffen "Tasse" und "Becher" zu erfassen, indem man systematisch geometrische Formen erzeugt hat, die zwischen einer eindeutig (von allen muttersprachlichen Probanden) als Tasse und einer eindeutig als Becher identifizierten Form variieren. Es zeigen sich hier ein Kernbereich von Formen, die eindeutig der einen oder anderen semantischen Kategorie zugeordnet werden können, und ein diffuser Zwischenbereich, in dem muttersprachliche Probanden zu verschiedenen Urteilen kommen.

h1 zeichnet die Textpassage als Überschrift aus. Das aber ist nur die Funktion in der Struktur des Dokuments, nicht die Bedeutung dessen. Es geht daraus weder hervor, dass QE2 und Tim Berners-Lee Personen sind, noch welche Beziehung zwischen ihnen besteht. Genau das aber wäre Semantik.*

Nein. Auch die Bedeutung ("Dies ist eine Überschrift") gehört zur Semantik.

HTML zeichnet logisch aus, nicht semantisch.

Das ist ein interessanter Gedanke. Angesichts der Bedeutungsarmut der HTML-Tags gemessen an der Vielfalt der damit strukturierten Texte könnte man diesen Gedanken weiterentwickeln und ihre Strukturierungsfunktion gegenüber der semantischen Funktion hervorheben. Tatsächlich sind die Tags in diesem Sinne angewandt dennoch nicht bedeutungsleer.

Selbst hinter dem address-Element verbirgt sich nicht wirklich Semantik: Es könnte der Name des Autors, seine Postadresse, E-Mail, Telefon- oder Faxnummer drinstehen. (Oder das Element zur Darstellung in Kursivschrift missbraucht worden sein.)

Semantik bedeutet nicht, dass Begriffe mathematisch exakt nur einen konkreten Gegenstand bezeichnen dürfen.

Um wirklich Semantik ins Web zu bringen, bedarf es Topic Maps, RDF, OWL, ...

Über XML ist es möglich, Tags mit höherem Bedeutungsgehalt zu generieren. Ein Problem bleibt, dass dies erfolgreich nur in Bezug auf streng kategorisierte Inhalte, also etwa die Inhalte von Tabellen, erfolgreich umsetzbar ist. Aber auch hier zeigen sich in der Praxis Probleme: Wer schon einmal mit umfangreichen Datenbanken gearbeitet hat, weiß, dass sich die Wirklichkeit nicht immer so ohne weiteres in Tabellenform darstellen lässt, auch wenn ich immer noch davon träume, mal etwas darüber zu schreiben, in welchem Umfang die Form der Datenerfassung Einfluss auf unser Denken und unsere Wirklichkeitswahrnehmung, sogar auf die Wirklichkeit selber genommen hat.

Viele Grüße
Mathias Bigge

--
http://aktuell.de.selfhtml.org/tippstricks/index.htm
"Jemanden zu lieben ist die Ausnahme, nicht zu lieben die Regel. Wenn man diese Regel beachtet, könnte man einen ersten Schritt ins Glück tun."
<img src="http://www.vfz.de/vfz_daten/studenten/jpg/DSC00696.jpg" border="0" alt="">