molily: Google möchte keine versteckten Keywords mehr

Beitrag lesen

Hallo,

Mir stellt sich viel weitergehend die Frage, wozu XHTML überhaupt gut sein soll.

Ich habe diesbezüglich lediglich einen Grauen gegen die unredliche Werbung für XHTML. XHTML ist schön und gut, wenn man es auf simple praktische Vorteile wie die Schlüssigkeit und Konsequenz der Syntax usw. herunterbricht.
Sobald man aber Webautoren von irgendwelchen genuinen Vorteilen von XHTML als XML überzeugen will, so bricht meist alles in sich zusammen. Die Praxis zeigt, dass das wirklich nur Luftschlösser sind. Wer HTML 4 beherrscht und keinen konkreten Nutzen in diesen eigentümlichen Vorteilen sieht, soll um Himmels Willen nicht dem XHTML-Hype verfallen, der momentan sowieso größtenteils fehlerhafte Dokumente erzeugt, die wenig mit XML zu schaffen haben.

Stellt sich wirklich jemand vor, ein XHTML-Dokument irgendwann mal als XML-Datenquelle zu benutzen und Daten aus diesem Dokument zu ziehen?

Zumindest wird das immer als potenzieller Vorteil von XHTML aufgeführt, aber in der Tat wird er selten genutzt. Ich zumindest extrahiere gerne z.B. über das DOM Daten aus statischen XHTML-Dateien, in denen ich Semantik unterbringe. Die Frage ist natürlich, ob es dazu XHTML bedarf. libxml2 z.B. hat auch einen guten HTML-Parser, der prinzipiell genauso breit verfügbar ist. Hier bei SELFHTML arbeiten wir letztlich auch mit vielen statischen HTML-4-Seiten, was zumindest nicht diese Art der Verarbeitung behindert.

Wozu? Weil eventuell die eigentliche XML-, Datenbank-, oder irgendwie anders angelegte Datenquelle verloren gegangen ist?

Tatsächlich wird XHTML seltenst als Speicherformat genutzt, man generiert eher XHTML aus eine vielseitigeren Quelle, die relationale Datenbank ist da wohl üblich. Andererseits kann diese Datenbank wiederum XHTML-formatierten Text enthalten, wenn nicht ein eigenes Markup erfunden wurde.

Wenn so, inwiefern erleichtert XHTML dann die Rückgewinnung der Daten? Welcher Unterschied besteht zwischen der Aussagekraft eines Hx, P, TD, UL/LI, OL/LI, EM, STRONG ... - Elementes aus XHTML gegenüber einem ebensolchen aus HTML?

XHTML erleichtert die Rückgewinnung insofern, dass ein XML-Parser nahezu überall in jeder Sprache und jeder Umgebung verfügbar ist. Aber wie du auch sagst:

Und nein, das Argument, XHTML zwänge zur korrekten Tag-Setzung, zieht nicht. Es existieren funktionierende HTML-Tag-Soup-Parser.

Für das Arbeiten mit XML stellen die üblichen Programmierumgebungen meiner Wahrnehmung nach ausgereiftere Techniken zur Verfügung.

Mathias

5 106

Google möchte keine versteckten Keywords mehr

wahsaga
  • zur info
  1. -5
    guest00534&45x$5x
  2. 0
    Alexander Brock
  3. 0

    Google und Brückenseiten

    Tom
    1. 0
      Thomas J.S.
    2. 0
      fastix®
      1. 2

        Google und verborgener Text

        Fritz
        • barrierefreiheit
        1. 1
          Sven Rautenberg
  4. 0
    Der Martin
  5. 2
    Jeena Paradies
  6. 1
    afra
  7. -1
    fastix®
  8. -2
    Julian von Mendel
    1. 0
      TomIRL
      1. 0
        Julian von Mendel
      2. 0
        Der Martin
    2. 1
      Jeena Paradies
      1. 0
        Julian von Mendel
        1. 0
          Gunnar Bittersmann
          1. 0
            Sven Rautenberg
            1. 2
              Jeena Paradies
              1. 0
                Julian von Mendel
                1. 1
                  Gunnar Bittersmann
                  1. 0
                    molily
                    1. 0
                      Axel Richter
                      1. 1
                        molily
                  2. 0
                    Tim Tepaße
                    • sonstiges
                    1. 0
                      Gunnar Bittersmann
                  3. 0
                    Andreas Kampitsch
                    1. 0
                      Der Martin
                      1. 0
                        Andreas Kampitsch
        2. 4
          Jeena Paradies
          1. -1
            at
            1. 0
              Jeena Paradies
        3. 0
          Cybaer
    3. 0
      Gunnar Bittersmann
      1. 0
        Julian von Mendel
        1. 0
          Cybaer
          1. 1
            Julian von Mendel
            1. 0
              Cybaer
              1. 0
                Julian von Mendel
              2. 0
                Der Martin
                1. 0
                  Cybaer
                  1. 0
                    Der Martin
                    1. 0
                      Cybaer
              3. 0
                Ashura
                1. 0
                  Der Martin
                  1. 0
                    Tim Tepaße
                    1. 0
                      Cybaer
                  2. 0
                    Ashura
                    1. 0
                      Der Martin
                      1. 0
                        Ashura
                        1. 0
                          Der Martin
                          1. 0
                            Ashura
              4. 0

                WHAT WG vs. W3C

                Tim Tepaße
                • sonstiges
    4. 2
      Sven Rautenberg
      1. 0
        Julian von Mendel
      2. 0
        Alexander Brock
        1. 0
          molily
          1. 0
            at
        2. 0

          Würdigt Google auch strukturell korrektes bzw. falsches Markup?

          Gernot Back
          • barrierefreiheit
          1. 0
            Alexander Brock
          2. 0
            molily
          3. 0
            Gunnar Bittersmann
          4. 0
            Andreas Lindig
            1. 0
              Gunnar Bittersmann
          5. -1
            at
            1. 0
              Gernot Back
              1. 3
                Andreas Lindig
                1. -1
                  at
              2. 0
                at
  9. 1

    Wir sind Google! oder doch nicht?

    Wilhelm Turtschan
    1. 0
      Der Martin
    2. 0
      Ashura
      1. 0
        fastix®
        1. 0
          Ashura
          1. 0
            fastix®
            1. 0
              Ashura
              1. 0
                at
                1. 0
                  Ashura
                  1. 0
                    at
                    1. 0
                      Ashura
                      1. 0
                        Ashura
                        1. -1
                          at
                          1. 0
                            Ashura
                            1. 0
                              at
                              1. 0
                                Ashura
                                1. 1
                                  at
                                  1. 1
                                    Ashura
        2. 0
          Der Martin
        3. 0
          at
      2. 0
        Jeena Paradies
        1. 0
          Struppi
          1. 0
            Cybaer
            1. 0
              molily
          2. 0
            Jeena Paradies
            1. 0
              Struppi
              1. 0
                Jeena Paradies
            2. 0
              at
        2. 0
          Ashura
          1. 0
            Jeena Paradies
            1. 0
              Ashura
              1. 0
                at
          2. 0
            Mathias Bigge
      3. 0

        Leider "normal"

        Cybaer
  10. 0

    Reaktion von BMW

    wahsaga