<tr ***> </tr> <td ***> <td>
Irgendwo zwischen dem xten <td ***>DATEN</td> stehen ja die Daten.
Mal eine ganz andere Idee: Wenn es sich bei diesen HTML-Dateien um wohlgeformtes XML handelt, ließe sich da doch bestimmt was mit XSL-Transformation machen. Wenn es Quirks-HTML ist, würde ich das PEAR-Package XML_HTMLSax3 vorher drauf anzusetzen probieren. In dem Paket gibt es auch ein Beispiel-Script HTMLtoXHTML.php