Halo Daniel!
Ok, man kann natürlich auch über die Semantik einzelner Wörter reden. Aber einen gültigen Satz kann man im Prinzip bauen, ohne die Semantik der Wörter zu kennen. Bei natürlicher Sprache ist das natürlich nicht so sauber getrennt, sodass die Semantik möglicherweise irgendwie in die Grammatik zurückgekoppelt ist. Bei künstlichen Sprachen sollte man sowas aber tunlichst vermeiden, und es gibt auch kaum Beispiele, bei denen das nicht so ist.
Syntax, Semantik und Pragmatik sind drei Aspekte einer untrennbaren Einheit, ob bei natürlichen oder formalisierten Sprachen. In der Semiotik ist die Semantik die Beziehung zwischen Zeichen und Objekten, die Syntax die Beziehung zwischen den Zeichen selbst und die Pragmatik die Beziehung zwischen Zeichen und Zeichenbenutzer. Der Begriff Semantik wird in sehr vielen Zusammenhängen mit durchaus unterschiedlicher Bedeutung gebraucht. Bezüglich semantisch korrektem HTML geht es aber lediglich um die sehr eingeengte Frage, wie semantisches Markup zu seiner Semantik kommt.
Nein, man muss nicht wissen, dass z.B. das table-Element etwas mit Tabellen zu tun hat, um zu wissen, dass darin nur tr-Elemente u.ä. vorkommen dürfen. Dazu reicht eine DTD die nur syntaktische Bedingungen enthält (in Form einer Art kontextfreien Grammatik).
Ja, falls der Mensch über die Fähigkeit verfügt, sich vollständig wie eine triviale Maschine zu verhalten.
Dass sie keine Semantik enhält, merkt man schon daran, dass man damit nicht beschreiben kann, wie ein Dokument darzustellen oder auszuwerten ist.
Semantik ist Bedeutung, nicht Darstellung.
Was man natürlich kennen muss, ist die Semantik von SGML/XML um die entsprechenden Syntaxdefinitionen zu verstehen, die Semantik von (X)HTML muss man aber dazu nicht kennen.
Gibt es zwischen SGML und HTML keinen Zusammenhang?
Jein, also die Semantik spielt natürlich eine Rolle. Man muss sie ja kennen, um darüber zu reden, wie man die Sprache verwenden soll. Aber Semantik ist wohl erstmal neutral. Da geht es nur darum, die Bedeutung zu erkennen oder festzulegen. Es geht nicht darum, zu entscheiden, welche Art der Verwendung nun gut oder böse ist. ;-)
Der Verzicht auf Semantik ist immer böse oder zumindest irgendwie gestört. ;-) Der sinnvolle Gebrauch von Sprache basiert doch auf Bedeutungen. Semantik ist nur ein Aspekt des Sprachgebrauchs.
Mich interessiert, auf welche Lehrmeinungen, Theorien und Autoren du deine Aussagen und Schlussfolgerungen beziehst. Der Grund meines Interesses ist der: Ich schreibe im Moment an einem Artikel über die Semantizität von semantischem Markup. In natürlichen Sprachen erhalten die Zeichen (Wörter, Sätze usw.) ihre Bedeutungen durch den intersubjektiven Gebrauch der Sprache. Das Wort "Baum" kann seine Bedeutung durch den jeweils aktuellen Sprachgebrauch verändern. In formalisierten Sprachen wie HTML wird genau dieser Vorgang unterbunden, wie die oft Gift und Galle versprühenden Diskussionen über semantisches Markup zeigen. "Wörter" wie <br><br> für Textabschnitte dürfen nicht deshalb als semantisch akzeptiert werden, nur weil Millionen von Webdesignern sie verwenden. Die Semantik formalisierter Markup-Sprachen wie HTML wird nun mal nach den Regeln der Syntax festgelegt, das ist möglich, weil in der Informatik aus logischen Gründen keine der Linguistik vergleichbare Unterscheidung zwischen Syntax und Semantik gemacht wird. Elemente wie <p></p> oder <hx></hx> haben aber trotzdem eine Bedeutung, sind also semantisch und nicht nur syntaktisch.
Beste Grüsse
Richard