Wenn ein Extrahierwerkzeug so unklug ist, dass es eine Tabelle mit "richtigen Daten" nicht von einer "wilden Tabelle" unterscheiden kann, dann finde ich das (auch wenn du im Prinzip gar nicht so unrecht hast) etwas arm. Denn immerhin sind richtige Tabellen auch mit "caption", "th" und all so nem Zeug versehen, die anderen Tabellen sind es naturgemäß nicht, weil sie keine logische Funktion erfüllen.
Und ich finde es erpresserisch oder zumindest höchst zweifelhaft, dem eigenen technischen Unvermögen zu erlauben, daß er dem Rest der Welt solche Vorschriften auferleget. Das ist gleich doppeltes Scheitern: technisches und soziales.
Man kann auch nicht verlangen, dass alle Fußgänger daheim bleiben sollen, weil man es ziemlich schick findet, nachts mit Sonnenbrille Auto zu fahren oder weil der Autopilot Rechts- und Linkskurven noch nicht sicher unterscheiden kann.
Der beklagte Missbrauch wird auf jeden Fall weitergehen, obwohl die Webmaster damit selbst nicht so glücklich sind. Jedoch ist es nicht ihre Schuld, daß andere Lösungen nicht sehr sauber funktionieren bzw. nicht sonderlich kompatibel und zudem kompliziert und unelegant sind oder andere Missliebigkeiten mit sich bringen. Das haben andere Instanzen verursacht.
Und für deinen Elitarismus, nach dem nur Webmaster gut sind, die trotz aller Widrigkeiten (inklusive deiner persönlichen Ansprüche) etwas Brauchbares fabrizieren können, kann ich mir auch nicht viel Verständnis abringen. Besonders dann nicht, wenn ich mir vergegenwärtige, aus welchen Umständen diese Ansprüche/Zwänge erwachsen.
Und letztlich muss der fähige Extraktor ja doch nur ein einziges Mal geschrieben werden. Warum also sollen stattdessen alle Webautoren zigtausendfach ihre Seiten Extraktor-gerecht formulieren??? Das ist nicht einzusehen.