Hallo,
die Diskusion ist ja ganz interessant aber eigentlich überflüssig. Das maschinelle auslesen scheitert sicher nicht an der weit verbreiteten Verwendung der Tabellen (die so auch nach allen Standards legitim ist) sondern entweder an der faulheit oder an der unfähigkeit des Programmierers.
Viele Grüße
Alexander
P.S.: Das schöne an Standards ist ja daß man so viele davon haben kann. Deshalb gibts ja von HTML 1.0 bis XHTML 2.0 alles und es wird in 10 Jahren immer noch Dokumente geben die nur einem HTML 1.0 gerecht werden. Da haben wir jetzt zwei möglichkeiten:
1. Wir lernen damit zu leben und entsprechende Software zu entwickeln.
2. Wir ignorieren das ganze Wissen in angeblich nicht Standard konformen HTML-Dateien.
Ich bin für die erste Möglichkeit erstens eine Herausforderung der man sich stellen sollte und bei Möglichkeit Nummer zwei könnte es sein daß wird mehr verlieren als uns lieb ist.