Thomas Hofmann: RE: XML echte Teilmenge von SGML?

ursprünglicher Beitrag:
http://www.teamone.de/selfhtml/sfarchiv/1999_3/t06891.htm
von: Karl,  k.a.r.l@iname.com
geschrieben am: 26.9.99, 04:36 Uhr

XML-Anfänger Frage: ist XML eigentlich eine echte Teilmenge von SGML?

Nein, nicht ganz. Ein Unterschied ist z.B., daß bei XML die empty-Tags <br /> geschrieben werden, bei SGML <br>. Siehe dazu auch XHTML Anhang C:
http://www.w3.org/TR/xhtml1/#guidelines

Will meinen: kann einer SGML Anwendung (z.B. für professionelle Satztechnik) ohne weiteres XML vorgestzt werden und diese verdaut es (ohne Rülpsen)?

Nein

Wenn nicht: wie aufwendig ist es XML in SGML umzusetzen?

Das kommt auf die DTD und die verwendeten Features an.

Gibt es hierfür (schon) SW auf dem Markt? Welche?

Ich glaube nicht, daß Du fertige SW für "XML->SGML" bekommst, wenn schon dann eher für "SGML->XML". Es ein paar Konverter, die schon von SGML her bekannt sind: Balise, Omnimark. Inwieweit sie zu "sowas" geeignet sind, hab ich persönlich noch nicht getestet. Man kann aber auch anderes dafür benutzen.

Falls kein Produkt verfügbar: wer hat damit Erfahrung (z.B. mit Perl)?

Mit Perl sollte es kein unlösbares Problem sein.

Gruß, Thomas
http://th-o.de/sgml/
German Home of SGML
deutscher Checkpoint für alles rund um SGML/XML

  1. Moin Thomas

    XML-Anfänger Frage: ist XML eigentlich eine echte Teilmenge von SGML?

    Nein, nicht ganz. [...] Siehe dazu auch XHTML Anhang C:
    http://www.w3.org/TR/xhtml1/#guidelines

    Die Frage bezog sich auf XML, nicht XHTML. Warum verweist du auf XML

    Unter  http://www.w3.org/TR/1998/REC-xml-19980210 steht was anderes:
    <cite>Abstract
    The Extensible Markup Language (XML) is a subset of SGML that is completely described in this document. </cite>

    Was stimmt?
    Wenn ich micht recht erinnere (Quelle: das XML Buch von Mintert ?) wurde SGML sogar erweitert, um XML überhaupt möglich zu machen

    Swen

    1. Hallo Swen,

      Unter  http://www.w3.org/TR/1998/REC-xml-19980210 steht was anderes:
      <cite>Abstract
      The Extensible Markup Language (XML) is a subset of SGML that is completely described in this document. </cite>

      Was stimmt?

      Soweit ich weiss, ist XML eine echte Teilmenge von SGML und auch nur als solche sinnvoll.

      XML ist einfacher gehalten als SGML. Einfacher heißt hier v.a. strikter. S. das altbekannte Beispiel mit den End-Tags.
      HTML 4.0 z.B. ist in SGML definiert, d.h. nach den HTML-4.0-DTDs darf man noch <br> und <img> ohne Endtag benutzen.
      In XHTML der Reformulierung von HTML in XML geht dies nicht mehr.

      Wenn ich micht recht erinnere (Quelle: das XML Buch von Mintert ?) wurde SGML sogar erweitert, um XML überhaupt möglich zu machen

      Kann ich nichts zu sagen.

      Bis denn
      Franz

      1. Hallo nochmal,

        Wenn ich micht recht erinnere (Quelle: das XML Buch von Mintert ?) wurde SGML sogar erweitert, um XML überhaupt möglich zu machen

        Kann ich nichts zu sagen.

        hab  doch nochwas gefunden:

        SGML wurde tatsächlich erweitert, um XML zu einer echten Teilmenge von SGML zu machen. Raus kam WebSGML:
        http://www.sgmlsource.com/8879rev/index.htm

        Es können also tatsächlich Probleme mit Anwendungen auftauchen, die nur das ursprünglich SGML verstehen. Offensichtlichste Änderung ist die Einführung der Wohlgeformtheit, also der Möglichkeit, die DTD wegzulassen, was beim "alten" SGML nicht möglich war.

        Guter Artikel ist auch:
        http://www.w3.org/TR/NOTE-sgml-xml-971215

        Gruss
        Franz

    2. Hallo Swen,

      XML-Anfänger Frage: ist XML eigentlich eine echte Teilmenge von SGML?

      Nein, nicht ganz. [...] Siehe dazu auch XHTML Anhang C:
      http://www.w3.org/TR/xhtml1/#guidelines

      Die Frage bezog sich auf XML, nicht XHTML. Warum verweist du auf XML

      Wie schon weiter unten geschrieben wurde: HTML  ist ein Dokumenttyp von SGML (die DTD für HTML eben).
      XHTML ist das auf XML Verträglichkeit umgeschriebene HTML. Deshalb.

      Unter  http://www.w3.org/TR/1998/REC-xml-19980210 steht was anderes:
      <cite>Abstract
      The Extensible Markup Language (XML) is a subset of SGML that is completely described in this document. </cite>

      Was stimmt?

      Wir haben also zwei Quellen, beide vom W3C. Frag die mal, ich hab meine begründete Meinung, eben z.B. die Endetags bei empty-Elementen.

      Wenn ich micht recht erinnere (Quelle: das XML Buch von Mintert ?) wurde SGML sogar erweitert, um XML überhaupt möglich zu machen

      Ich denke mal Stefan Mintert (der hier zitierte) könnte sich ja auch mal selbst melden. Aber davon abgesehen, für mich ist SGML immer noch ISO Standard 8879 von 1986. Alle alten Tools arbeiten mit keinen Erweiterungen.

      beste Grüße, Thomas

      1. Moin Thomas

        Die Frage bezog sich auf XML, nicht XHTML. Warum verweist du auf XML

        upps. Es hätte heißen sollen: Warum verweist du auf XHTML

        Wie schon weiter unten geschrieben wurde: HTML  ist ein Dokumenttyp von SGML (die DTD für HTML eben).
        XHTML ist das auf XML Verträglichkeit umgeschriebene HTML. Deshalb.

        Falsch. Die Frage lautete: "ist XML eigentlich eine echte Teilmenge von SGML". Diese Frage hast du nicht beantwortet.

        Wir haben also zwei Quellen, beide vom W3C.

        Richtig. Nur: beide belegen nicht deine Behauptung
        nhaupmeine ist einschlägig, deine ist hier irrelevant. Nochmal es geht um XML. Und da ist

        Frag die mal, ich hab meine begründete Meinung, eben z.B. die Endetags bei empty-Elementen.

        Brauch ich nicht. Ich schau mal hier nach: <q cite="http://www.sgmlsource.com/8879rev/n0029.htm">Note 23: For example, if the nestc is "/" and the net is ">", and "img" is either not a mandatorily empty element or is a mandatorily empty element and EMPTYNRM YES is specified, then:

        <img/>

        can be used as an alternative to
        <img></img>

        </q>

        [...] Aber davon abgesehen, für mich ist SGML immer noch ISO Standard 8879 von 1986. Alle alten Tools arbeiten mit keinen Erweiterungen.

        Ähh, du blendest einfach alles nach 1986 (ISO 8879 TC2 usw.)
        aus ? ;-)

        Swen

        1. Korrektur

          »»  nhaupmeine ist einschlägig, deine ist hier irrelevant. Nochmal es geht um XML. Und da ist

          Dieser Satz gehört gestrichen

          Swen

        2. Moin Thomas

          Nabend Swen,

          Ähh, du blendest einfach alles nach 1986 (ISO 8879 TC2 usw.)
          aus ? ;-)

          Das habe ich nicht geschrieben, ich blende nichts aus, auch nicht XML, was nach ... kommt. Das ist eine Interpretation und zwar Deine.

          beste Grüße
          Okay, Du hast recht und ich nicht, zufrieden?

      2. Hallo Thomas!

        Wie schon weiter unten geschrieben wurde: HTML  ist ein Dokumenttyp von SGML (die DTD für HTML eben).
        XHTML ist das auf XML Verträglichkeit umgeschriebene HTML.

        Das bestreitet doch niemand.
        Ebenso ist XML eine Teilmenge von SGML (von mir aus können wir es document typ nennen; wenn wir bei der SGML-Terminologie bleiben und document type als eine Gruppe von Dokumenten, denen ein Satz von Regel zugrunde leigt betrachten. Dieser Satz von Regel wird dann DTD genannt)

        Wir haben also zwei Quellen, beide vom W3C. Frag die mal, ich hab meine begründete Meinung, eben z.B. die Endetags bei empty-Elementen.

        Was ist damit begründet? Das verstehe ich nicht.
        Daß im ISO-8879 die Tagminimalisierung *empfohlen* wurde a'la " - O " und das leere Elemente in diese Kategorie gehören?
        Fein. Ist aber nur eine Feststellung und keine Begründung.
        Es ist in SGML auch möglich die "short tag minimalisation" also z.B. kann ich locker einen Konstrukt wie: <bereich<titel>Der Titel</abschnitt</bereich> (sic!) verwenden.
        Daß die XML-DTD sowas nicht vorsieht hat damit gar nichts zu tun.

        <cite>
        Die Meta-Sprache XML ist eine Untermenge der Meta-Sprache SGML und alle XML-Dokumente sind auch SGML-Dokumente, falls eine DTD für die Validierung verfügbar ist.
        HTML ist eine SGML-Anwendung und nutzt SGML-spezifische Sprachelemente, die nicht XML-konform sind.
        </> http://ftp.linguistik.uni-erlangen.de/kursmaterial/Uebung_WS9899/node75.html

        Wenn ich micht recht erinnere (Quelle: das XML Buch von Mintert ?) wurde SGML sogar erweitert, um XML überhaupt möglich zu machen
        Ich denke mal Stefan Mintert (der hier zitierte) könnte sich ja auch mal selbst melden.

        Aber, aber, warum sollte er das?!
        Wir wollen doch nicht derart argumentieren, oder?
        Übrigens er hat das gemacht: http://irb-www.informatik.uni-dortmund.de/~sm/aw/xml/netscape/kap1.html#1 mit Grafik und Erklärung.

        »»Aber davon abgesehen, für mich ist SGML immer noch ISO Standard 8879 von 1986. Alle alten Tools arbeiten mit keinen Erweiterungen.

        Die Kirche sagte, daß der Zentrum des Universums die Erde sei. Und daran hilten sie sich einige hunderte Jahre. Aber deshalb war diese "Überzeugung" noch nicht richtig, oder?

        Wenn du sagts, daß für dich nach wie vor ISO-8897 von 1986 gilt, ist es ok. Das heißt aber nicht, das die Erweiterungen die gemacht worden sind (oder gemacht werden) deshalb falsch sind.

        Grüße
        Thomas