Tom: Zelleninhalte mittels PHP extrahieren

Beitrag lesen

Hello,

ich muss mit PHP die Zelleninhalte von HTML-Elementen, ahuptsächlich von Tabellenzellen, extrahieren. Die Seite muss also irgendwie HTML-geparst werden.

Mit den XML-Parser Funktionen von PHP kommt man da ja nicht weiter.

Kennt jemand eine fertige Klasse oder Funktionensammlung zu diesem Thema?

Es würde mich natürlich auch reizen, das mal selbst zu lösen, da fehlt mir aber im Monet die Idee, wie das sinnvoll werden könnte. Es geht ja darum, sich wiederholende Strukturen irgendwie zu erkennen und dann auslesen zu können.

Dabei kann es natürlich passieren, dass z.B. die </td> Tags fehlen oder die Paragraphs als <p /> geschrieben werden oder auch <img ... /> und <input .../> mal benutzt werden und mal nicht...

Wie würdet Ihr da vorghehen?

Harzliche Grüße aus http://www.annerschbarrich.de

Tom

--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau