dedlfix: Reguläre Ausdrücke

Beitrag lesen

<tr ***> </tr> <td ***> <td>

Irgendwo zwischen dem xten <td ***>DATEN</td>  stehen ja die Daten.

Mal eine ganz andere Idee: Wenn es sich bei diesen HTML-Dateien um wohlgeformtes XML handelt, ließe sich da doch bestimmt was mit XSL-Transformation machen. Wenn es Quirks-HTML ist, würde ich das PEAR-Package XML_HTMLSax3 vorher drauf anzusetzen probieren. In dem Paket gibt es auch ein Beispiel-Script HTMLtoXHTML.php