Tim Tepaße: Aufruf: Beendet doch Missbrauch von <table>

Beitrag lesen

Hallo Eddie,

Wenn ein Extrahierwerkzeug so unklug ist, dass es eine Tabelle mit
"richtigen Daten" nicht von einer "wilden Tabelle" unterscheiden kann, dann
finde ich das (auch wenn du im Prinzip gar nicht so unrecht hast) etwas arm.

Ich nicht. Weil das recht schwierig ist, denn ...

Denn immerhin sind richtige Tabellen auch mit "caption", "th" und all so
nem Zeug versehen, die anderen Tabellen sind es naturgemäß nicht, weil sie
keine logische Funktion erfüllen.

... die Bedingung der Anreicherung der Tabelle mit zusätzlichen Informationen
ist nichts, daß man verallgemeinern kann. Ich denke, im Web gibt es massig
mehr Datentabellen (sprich: Nicht Layouttabellen), denen hilfreiche
Auszeichnung mit den entsprechenden Attributen, zusätzliches wie caption
aber auch etwas wie th fehlt. Einfach aus verständlichlicher Faulheit der
Autoren, schließlich muß man sich da nicht nur Arbeit sondern auch eine
Menge Gedanken machen.

Und wenn man dieses von Dir vorgeschlagene Charakteristkum nicht mehr hat,
dann hat man keine wirklich Möglichkeit mehr, exakt zu entscheiden, ob ein
mit <table> ausgezeichneter Inhalt eine 2-dimensionale Datenstruktur oder
nur eine Layouttabelle ist. Sicher, man kann durch Empirie ein paar
Indikatoren aufstellen (beispielsweise die Anzahl der miteinander
verschachtelten Elemente in einer Tabellenzelle) und das ganze mit einem
willkürlich festgelegten Schwellwert vergleichen, Exaktheit erreicht man
dadurch nicht.

Und ich finde es erpresserisch oder zumindest höchst zweifelhaft, dem
eigenen technischen Unvermögen zu erlauben, daß er dem Rest der Welt
solche Vorschriften auferleget. Das ist gleich doppeltes Scheitern:
technisches und soziales.

Also das ist etwas sehr harsch formuliert. Effektiv richtet er sich bei
der Gestaltung seines Extraktors an den technischen Standards, die diese
Vorschriften auferlegen (Ja, ich weiß daß es Differenzen bei der Auslegung von Tabellen gibt, aber der Zustand der Tabellensuppe als einzige
Auszeichnung ist nicht, was der Standard sagt). Was er sich wünscht, ist
die Einhaltung dieser Standards durch die Webautoren. Ja, etwas blind bzw.
sehr utopisch ist seine Aufforderung gemessen an der derzeitigen Praxis
des Webs, das hätte er bedenken müssen.

(..) Jedoch ist es nicht ihre Schuld, daß andere Lösungen nicht sehr
sauber funktionieren bzw. nicht sonderlich kompatibel und zudem
kompliziert und unelegant sind oder andere Missliebigkeiten mit sich
bringen. Das haben andere Instanzen verursacht.

Führst Du mir da einiges von auf? Ich kann Deine Probleme mit den »anderen
Lösungen« nicht wirklich nachvollziehen. Vor drei bis vier Jahren vielleicht,
ja, heutzutage aber nicht mehr. Und nein, auch nicht im Netscape 4.x

(..) Extraktor-gerecht (..)

Standardgerecht, nicht extraktorgerecht. Etwas übertrieben: Du schreibst
ja auch nicht, um einem modischen Spleen eines Deiner Mitmenschen zu
gefallen (Ausnahme natürlich: Liebesbriefe ;-) ), sondern richtest Dich zur
besseren Verständlichkeit nach den Regeln der deutschen Sprache.

Tim

0 128

Aufruf: Beendet doch Missbrauch von <table>

Andreas
  • html
  1. 0
    fastix®
    1. 0
      Andreas
      1. 0
        Maximilian Baumgart
      2. 0
        Christian Seiler
      3. 0
        Alexander
    2. 0
      Christian Seiler
      1. 0
        fastix®
        1. 0
          Christian Seiler
          1. 0
            fastix®
            1. 0
              Cyx23
              1. 0
                fastix®
                1. 0
                  Christian Seiler
                  1. 0
                    fastix®
                    1. 0
                      Christian Seiler
  2. 0

    Aufruf: Beendet doch Missbrauch von HTML

    Cyx23
    1. 0
      Andreas
      1. 0
        Harry
        1. 0
          Dominik
      2. 0
        Alexander
    2. 0
      fastix®
      1. 0
        Christian Seiler
        1. 0
          Andreas
          1. 0
            Christian Seiler
        2. 0
          fastix®
          1. 0
            Christian Seiler
            1. 0
              fastix®
              1. 0
                Christian Seiler
                1. 0
                  fastix®
                  1. 0
                    Cyx23
                    1. 0
                      fastix®
                      1. 0
                        Cyx23
                        1. 0
                          fastix®
                          1. 0
                            Cyx23
                  2. 0
                    Christian Seiler
                    1. 0
                      Tim Tepaße
                      1. 0
                        Christian Seiler
                        1. 0
                          Tim Tepaße
                          1. 0
                            at
                    2. 0
                      fastix®
        3. 0
          molily
      2. 0
        Chräcker Heller
        1. 0
          fastix®
          1. 0
            Chräcker Heller
            1. 0
              molily
              1. 0
                at
    3. 0
      Chräcker Heller
  3. 0
    dbenzhuser
    1. 0
      08/15
      1. 0
        dbenzhuser
      2. 0
        fastix®
        1. 0
          Christian Seiler
        2. 0
          08/15
          1. 0
            fastix®
        3. 0
          dbenzhuser
          1. 0
            at
            1. 0
              dbenzhuser
              1. 0
                at
        4. 0
          Leo T.
      3. 0
        Tim Tepaße
  4. 0
    emu
    1. 0
      at
      1. 0
        emu
        1. 0
          at
  5. 0
    Heiner
    1. 0
      emu
      1. 0
        Heiner
      2. 0
        fastix®
  6. 0
    Chräcker Heller
    1. 0
      at
  7. 0
    Sven Rautenberg
    1. 0
      at
  8. 0

    Beende den Missbrauch von <table> nimm XML

    MatzeA
    1. 0
      Lars T.
      1. 0
        CurtB
        1. 0
          Wilhelm Turtschan
          1. 0
            emu
            1. 0
              Wilhelm Turtschan
              1. 0
                at
                1. 0
                  Wilhelm Turtschan
                  1. 0
                    at
                    1. 0
                      Wilhelm Turtschan
                      1. 0
                        at
                  2. 0
                    Orlando
                    1. 0
                      Wilhelm Turtschan
                      1. 0
                        Orlando
                        1. 0
                          Wilhelm Turtschan
          2. 0
            TomIRL
          3. 0
            CurtB
          4. 0
            at
        2. 0
          at
  9. 0
    molily
  10. 0
    Jan W.
  11. 0
    Alexander
  12. 0
    Stefan Muenz
    1. 0
      molily
      1. 0
        Stefan Muenz
        1. 0
          Tim Tepaße
          1. 0
            Alexander
            1. 0
              at
              1. 0
                Alexander
                1. 0
                  at
                  1. 0
                    Alexander
                2. 0
                  Michael Jendryschik
                  1. 0
                    Alexander
            2. 0
              Michael Jendryschik
              1. 0
                Tim Tepaße
              2. 0
                Alexander
                1. 0
                  Michael Jendryschik
                  1. 0
                    Alexander
                    1. 0
                      Michael Jendryschik
      2. 0
        Michael Jendryschik
    2. 0
      Tim Tepaße
      1. 0
        Stefan Muenz
        1. 0
          Tim Tepaße
    3. 0
      Michael Jendryschik
      1. 0
        Stefan Muenz
        1. 0
          erika
          1. 0
            at
            1. 0
              Stefan Muenz
              1. 0
                at
                1. 0
                  erika
                  1. 0
                    at
                    1. 0
                      erika
                      1. 0
                        at
      2. 0
        molily
  13. 0
    eddie
    1. 0
      Tim Tepaße