Hallo Daniel!
Hm, also ich kann schon allein mit einer formalen Grammatik arbeiten ohne die Bedeutung zu kennen. Aber vielleicht muss man dafür mit theoretischer Informatik beschäftigen ;)
oooch... nööö...! Ihr Informatiker gebärdet euch immer so elitär. Dabei können doch fast alle Menschen problemlos mit etwas arbeiten ohne die Bedeutung zu verstehen. ;-)
Schon vor Jahrzehnten spottete ich, Informatiker gebe es bei Quelle. Der Grund war der, dass Karl Steinbuch den Begriff Informatik (für Informationsverarbeitung durch Automaten) in Zusammenhang mit einem Projekt für Quelle geprägt hat. Steinbuch arbeitete damals an der Lernmatrix und ich konstruierte auf kommerzieller Basis Lernmaschinen. Beide waren wir Gründungsmitglieder der GPI, was heute für "Gesellschaft für Pädogogik und Information" steht, damals aber weit prägnanter für "Gesellschaft für Programmierte Instruktion". Einig waren wir uns mindestens darin, dass Pädagogen und Bildungspolitiker falsch programmiert sind.
Was ist daran semantisch? Diese Zuordnung folgt festgelegten Regeln, ist also syntaktischer Art.
Nur weil etwas gestgelegt ist, ist es nicht gleich Syntax. Wie Du selbst gesagt hast, ist Syntax allein auf Basis der Zeichen definiert. Daran lässt sich recht gut erkennen, wo die Syntax einer formalen Sprache aufhört. Welche Formatierung eine CSS-Regel zur folge hat, lässt sich eben nicht allein auf Basis der Zeichen beschreiben, aus denen sie besteht.
Semantik ist in einer natürlichen Sprache nicht per Definition enthalten, sondern entsteht erst durch deren Gebrauch. Der Gebrauch einer formalisierten Sprache darf aber nicht zu einer veränderten Semantik führen. Deshalb ist die Auswirkung auf die Interaktion und Kommunikation eine völlig andere. CSS-Regeln müssen einfach hingenommen und wie definiert angewandt werden, was die Bedeutung des Zeichens "Baum" bedeutet, kann sich dagegen nur in vollzogener Kommunikation erschliessen.
Interessant wäre die Frage, warum in der Informatik in diesen Fällen von Semantik gesprochen wird.
Weil es Semantik ist. Es wird beschrieben, was mit einer Zeichenfolge gemeint ist, es wird _nicht_ beschrieben, wie diese Zeichenfolgen aufgebaut werden müssen.
Lass micht zurück kommen auf den Ausgangspunkt. Es ging darum, dass beim Reden über semantisch korrektes HTML, also semantisches Markup, erklärt werden sollte, was mit Semantik gemeint ist. Dabei geht es zunächst um die korrekte Verwendung der Tags (korrekt im Sinne der Erfinder!), also <hx></hx> für Überschriften (genauer: *nur* für Überschriften und für Überschriften *zwingend*). <hx> steht eindeutig für eine Überschrift, das ist definierte Semantik dieses Tags. Im Sinne Wittgensteins oder Luhmanns kann auch eindeutig unterschieden werden: Es findet eine korrekte oder keine korrekte Verwendung des Tags statt, es handelt sich folglich um semantisch korrektes oder semantisch unkorrektes Markup. Dabei wird aber vorausgesetzt, dass völlige Klarheit darüber besteht, was eine Überschrift ist. Genau darüber lässt sich in der Alltagssprache aber endlos und ohne endgültiges Ergebnis diskutieren. Insofern funktioniert die Semantik formaler Sprachen nicht ohne Rückgriff auf natürliche Sprache.
Okey, es wird bezüglich der Struktur nicht das ausgedrückt, was vermutlich ausgedrückt werden sollte. Das Markup ist deswegen nicht "unsemantisch", sondern es wird einfach etwas falsches gesagt. In etwa so wie "Die Erde ist eine Scheibe." nicht "unsematisch" ist, sonder eben einfach eine falsche Aussage.
Genau darin besteht die Problematik des Begriffs "semantisches Markup". Wenn es kein unsemantisches Markup geben kann, kann es auch kein semantisches geben, weil eine Unterscheidung unmöglich ist. Der Begriff ist aber nun mal gebräuchlich und drückt verkürzt schon das Gemeinte richtig aus.
Was ist mit der strickten Trennung von Struktur und Darstellung?
Diese ist mit HTML nicht vollständig möglich oder sinnvoll. Die HTML-Spezifikation enthält angaben zur Darstellung und auch zum Verhalten z.B. von Links oder Formularelementen.
Diese Meinung teile ich durchaus. Allerdings weichst du damit der entscheidenden Frage aus. Im Raum steht die Behauptung, da sei irgend etwas zu trennen, Struktur und Darstellung, Inhalt und Form, Information und Layout, oder was auch immer. Es fehlen aber die Antworten, was genau zu trennen ist und was nicht.
Und was ist Struktur: Syntax oder Semantik?
Die Struktur von HTML ist natürlich Syntax, die Struktur des Dokuments (die HTML beschreibt) ist Semantik.
Struktur und Inhalt ist aber nicht zu trennen, dann wäre ja der Code sowohl Syntax als auch Semantik. Es wäre dann immer noch zu klären, mit welchen Interpretationsfunktionen vom syntaktischen und den semantischen Bereich gewechselt wird.
Naja, jedenfalls fährt man besser damit, zu Berücksichtigen welche strukturierende Bedeutung Elemente haben. Übertreiben sollte man die Wichtigkeit aber auch nicht.
Das ist eine sehr pragmatische Einstellung.
An dieser Stelle muss ich die interessante Diskussion ab- oder mindestens unterbrechen, ich muss mich gleich auf den Weg nach Genf machen, um in den nächsten Tagen ein wenig über die Bedeutung des SemanticWeb für das WebBasedTraining zu diskutieren. Vielleicht interessiert dich dieser Artikel, er stammt aus der Sammlung über den Web Science Workshop von Berners-Lee.
Beste Grüsse
Richard