Norbert: Suchbegriff gesucht

Hallo,

nach was muss man suchen, um eine Liste aller Entities zu erhalten ?
Also zum Beispiel:
ä - ä
ß - ß
© - ©
€ - €
Schon mal vielen Dank fuer die Hilfe ...

Gruss Norbert

  1. Hi,

    suchst du http://de.selfhtml.org/html/referenz/zeichen.htm?

    MfG Hopsel

    --
    "It's amazing I won. I was running against peace, prosperity, and incumbency."
    George W. Bush speaking to Swedish Prime Minister unaware a live television camera was still rolling, June 14, 2001
    1. Hopsel,

      suchst du http://de.selfhtml.org/html/referenz/zeichen.htm?

      Die offiziellen Dokumente sind
        ENTITIES Latin 1
        ENTITIES Symbols
        ENTITIES Special
      bzw.
        ENTITIES Latin 1 for XHTML
        ENTITIES Symbols for XHTML
        ENTITIES Special for XHTML

      Gunnar

      --
      “I got my finger on the trigger / But I don’t know who to trust” (Bruce Springsteen, Devils and Dust)
      1. Hallo,

        suchst du http://de.selfhtml.org/html/referenz/zeichen.htm?

        Die offiziellen Dokumente sind

        [...]

        Eigentlich ist dies: http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=16387&ICS1=35&ICS2=240&ICS3=30 das offizielle Dokument. ;-)

        Grüße
        Thomas

        --
        Surftip: kennen Sie schon Pipolino's Clowntheater?
        http://www.clowntheater-pipolino.net/
        1. Hi,

          suchst du http://de.selfhtml.org/html/referenz/zeichen.htm?
          Die offiziellen Dokumente sind
          Eigentlich ist dies: http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=16387&ICS1=35&ICS2=240&ICS3=30 das offizielle Dokument. ;-)

          Hm. Wirklich?

          Wenn es um die Character-Entities geht, ist doch der SGML-Standard irrelevant - die können ja für jede SGML-basierte Sprache unterschiedlich festgelegt sein (der SGML-Standard definiert doch nur, wie Entities definiert werden können, aber nicht welche).

          XML kennt nur ne Handvoll (< > ' " & IIRC), HTML und XHTML kennen wesentlich mehr, weil wesentlich mehr in deren DTDs definiert werden, und wenn ich selber eine SGML-basierte Sprache erfinde, hab ich es doch in der Hand, wieviele und welche Character Entities ich in meiner eigenen DTD definiere.

          cu,
          Andreas

          --
          Warum nennt sich Andreas hier MudGuard?
          Schreinerei Waechter
          Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
          1. Hallo,

            suchst du http://de.selfhtml.org/html/referenz/zeichen.htm?
            Die offiziellen Dokumente sind
            Eigentlich ist dies: http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=16387&ICS1=35&ICS2=240&ICS3=30 das offizielle Dokument. ;-)

            Hm. Wirklich?

            Wenn es um die Character-Entities geht, ist doch der SGML-Standard irrelevant - die können ja für jede SGML-basierte Sprache unterschiedlich festgelegt sein (der SGML-Standard definiert doch nur, wie Entities definiert werden können, aber nicht welche).

            Im Annex D "Public Text" sind bereits viele entities "vordefiniert".
            Es ist richtig, dass dies keine Vorschrift ist, wie anderen Teiles des Standards, aber eine überaus gute "Empfehlung" (die auch das W3C befolgt *g*).

            XML kennt nur ne Handvoll (< > ' " & IIRC), HTML und XHTML kennen wesentlich mehr, weil wesentlich mehr in deren DTDs definiert werden,

            Jain. HTML und XHTML nützen ja zum größten Teil diese Entities (ISO 8897) oder wenn es neuere sind dann die ISO 10646 Namen dafür.
            Wenn man z.B. die HTMLlat1.ent Datei von HTML 4.01 öffnet, kann man sehr gut sehen aus welche ISO 8879 Entityset eine Entity übernommen wurde.
            z.B.
            <!ENTITY Auml   CDATA "&#196;" -- latin capital letter A with diaeresis,
                                              U+00C4 ISOlat1 -->

            Es gibt eine gute Mapping Übersicht dazu: ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MISC/SGML.TXT

            und wenn ich selber eine SGML-basierte Sprache erfinde, hab ich es doch in der Hand, wieviele und welche Character Entities ich in meiner eigenen DTD definiere.

            Gewiss. Aber es geht ja nicht darum, dass man für "Ä" etwas anderes als &Auml; oder &#196 bzw. &#xC4; definiert ;-)

            Grüße
            Thomas

            --
            Surftip: kennen Sie schon Pipolino's Clowntheater?
            http://www.clowntheater-pipolino.net/
            1. Hi,

              Im Annex D "Public Text" sind bereits viele entities "vordefiniert".
              Es ist richtig, dass dies keine Vorschrift ist, wie anderen Teiles des Standards, aber eine überaus gute "Empfehlung" (die auch das W3C befolgt *g*).

              Eben.

              Wenn man z.B. die HTMLlat1.ent Datei von HTML 4.01 öffnet, kann man sehr gut sehen aus welche ISO 8879 Entityset eine Entity übernommen wurde.
              z.B.
              <!ENTITY Auml   CDATA "&#196;" -- latin capital letter A with diaeresis,
                                                U+00C4 ISOlat1 -->

              Aber das zeigt doch genau, daß diese eben in HTML definiert werden. Und nicht in SGML, denn wenn sie dort bereits definiert wären, müßte man sie nicht in HTML nochmal definieren.

              und wenn ich selber eine SGML-basierte Sprache erfinde, hab ich es doch in der Hand, wieviele und welche Character Entities ich in meiner eigenen DTD definiere.
              Gewiss. Aber es geht ja nicht darum, dass man für "Ä" etwas anderes als &Auml; oder &#196 bzw. &#xC4; definiert ;-)

              Muß ja nicht was anderes für "Ä" sein, sondern vielleicht für Zeichen, die in meiner (fiktiven) eigenen Sprache eine besondere Bedeutung haben oder einfach auch einen Namen bekommen sollen, z.B. &at; oder &hash; oder &exclamation; für &#40; oder &#23; oder &#21; usw.

              cu,
              Andreas

              --
              Warum nennt sich Andreas hier MudGuard?
              Schreinerei Waechter
              Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
              1. Hallo,

                Wenn man z.B. die HTMLlat1.ent Datei von HTML 4.01 öffnet, kann man sehr gut sehen aus welche ISO 8879 Entityset eine Entity übernommen wurde.
                z.B.
                <!ENTITY Auml   CDATA "&#196;" -- latin capital letter A with diaeresis,
                                                  U+00C4 ISOlat1 -->

                Aber das zeigt doch genau, daß diese eben in HTML definiert werden.

                Nein, das zeigt, dass diese Entities in SGML definiert und ins HTML übernommen wurden. (Sonst wäre ja auch die Copyright-Kommentar mit dem Hnweis auf die ISO 8879, also auf dem SGMl-Standard überflüssig).

                »»Und nicht in SGML, denn wenn sie dort bereits definiert wären, müßte man sie nicht in HTML nochmal definieren.

                Man hat sie in HTML ja auch nicht (neu) definiert, man hat sie übernommen.
                Aber du solltest ja selber nachlesen können (Seite 114 ff.) ;-)

                Muß ja nicht was anderes für "Ä" sein, sondern vielleicht für Zeichen, die in meiner (fiktiven) eigenen Sprache eine besondere Bedeutung haben oder einfach auch einen Namen bekommen sollen, z.B. &at; oder &hash; oder &exclamation; für &#40; oder &#23; oder &#21; usw.

                Das ist klar. Mir ging es wirklich nicht darum, dass man nicht seine eigene Entities definieren können soll, sondern darum, welche bereits bekannt bzw. vorhanden sind.

                Grüße
                Thomas

                --
                Surftip: kennen Sie schon Pipolino's Clowntheater?
                http://www.clowntheater-pipolino.net/
                1. Hi,

                  Man hat sie in HTML ja auch nicht (neu) definiert, man hat sie übernommen.

                  Doch, erst dort werden sie wirklich definiert,

                  Aber du solltest ja selber nachlesen können (Seite 114 ff.) ;-)

                  hier wird ja nur beschrieben, welche entity sets mit welchen entity names es geben könnte/sollte.
                  Wären hier bereits die Entities an sich definiert, müßten sie in jeder SGML-basierten Sprache automatisch zur Verfügung stehen.

                  Die dort (S. 114ff) gegebenen "Definitionen" unterscheiden sich ja auch deutlich von denen in der HTML-DTD (Datentyp CDATA <---> SDATA, numerische Zeichenreferenzen <---> Eckige Klammern mit Entity Name drin)

                  Ein &auml; in einem XML ohne DTD müßte dann als ä erkannt werden - wird es aber nicht.

                  cu,
                  Andreas

                  --
                  Warum nennt sich Andreas hier MudGuard?
                  Schreinerei Waechter
                  Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
                  1. Hallo Andreas,

                    Man hat sie in HTML ja auch nicht (neu) definiert, man hat sie übernommen.

                    Doch, erst dort werden sie wirklich definiert,

                    Da haben wir wohl unterschiedliche Ansichten was das angeht.

                    Aber du solltest ja selber nachlesen können (Seite 114 ff.) ;-)

                    hier wird ja nur beschrieben, welche entity sets mit welchen entity names es geben könnte/sollte.
                    Wären hier bereits die Entities an sich definiert, müßten sie in jeder SGML-basierten Sprache automatisch zur Verfügung stehen.

                    Sie stehen ja zur Verfügung, wenn man diese Entitysets wie angegeben verwendet:

                    <!ENTITY % ISOlat1 PUBLIC "ISO 8879-1986//ENTITIES Added Latin 1//EN>
                    %ISOlat1;

                    Die dort (S. 114ff) gegebenen "Definitionen" unterscheiden sich ja auch deutlich von denen in der HTML-DTD (Datentyp CDATA <---> SDATA, numerische Zeichenreferenzen <---> Eckige Klammern mit Entity Name drin)

                    Das ist zwar ein Argument, aber nicht auf lange Sicht haltbar: es gibt verschiedene Adaptationen von diesen Entitysets, eben auch für XML, wie für DocBook XML z.B.

                    Darf ich in diesem Zusammenhang auf http://www.w3.org/2003/entities/ und weiter auf http://www.w3.org/2003/entities/iso8879doc/overview.html verweisen?

                    "ISO 8879 - These are the original entity names, as defined in the SGML standard."

                    Ein &auml; in einem XML ohne DTD müßte dann als ä erkannt werden - wird es aber nicht.

                    Natürlich wird es nicht. Ohne die Entity deklariert zu haben. (build-in Entities gibts nur wenige, wie du schon aufgezählt hast) Es ist ja auch nicht die aufgabe eines XML-Parsers ohne die entsprechende Deklaration jeden Entity zu verstehen. Warum sollte er das auch? Nur weil die Browser bei HTML einiges verstehen?

                    Vielleicht reden wir aneinander vorbei. Mir ging es ja nur darum, dass sehr viele der HTML/XHTML-Entities (Entitynamen) bereits in SGML definiert worden sind.

                    Grüße
                    Thomas

                    --
                    Surftip: kennen Sie schon Pipolino's Clowntheater?
                    http://www.clowntheater-pipolino.net/
                    1. Hi,

                      "ISO 8879 - These are the original entity names, as defined in the SGML standard."

                      "entity names", nicht "entities"

                      cu,
                      Andreas

                      --
                      Warum nennt sich Andreas hier MudGuard?
                      Schreinerei Waechter
                      Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
                      1. Hallo,

                        "ISO 8879 - These are the original entity names, as defined in the SGML standard."

                        "entity names", nicht "entities"

                        Hmm.. davon rede ich ja die ganze Zeit. Wenn ich die Originalfrage ansehe. Der Poster wollte "Zeichen --> Entity[name]" wissen.

                        Wie dem auch sei ... ;-)

                        Grüße
                        Thomas

                        --
                        Surftip: kennen Sie schon Pipolino's Clowntheater?
                        http://www.clowntheater-pipolino.net/
                        1. Hi,

                          "entity names", nicht "entities"
                          Hmm.. davon rede ich ja die ganze Zeit. Wenn ich die Originalfrage ansehe. Der Poster wollte "Zeichen --> Entity[name]" wissen.

                          Zitat aus dem Ursprungposting:
                          um eine Liste aller Entities zu erhalten

                          "Entities", nicht "Entity names" ;-)

                          cu,
                          Andreas

                          --
                          Warum nennt sich Andreas hier MudGuard?
                          Schreinerei Waechter
                          Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.