Thomas: Sehr gutes Website Data Extractiong Tool

Beitrag lesen

Hallo,

kennt jemand ein Tool mit dem man aus Websiten Daten extrahieren, bzw. parsen kann?

Bitte aber keine Sprüche wie "Selber in PHP einen Parser programmieren"!
Würde ich ja sofort machen und stellt auch kein Problem dar, aber es geht um mehrere hundert Seiten und es werden sicher noch viele mehr dazukommen, von denen Daten extrahiert werden müssen.

Ich sollte vielleicht auch noch erwähnen, dass dies rechtlich auch schon abgeklärt ist und 100%-ig zu keinen Problemen führen wird.

Also wenn jemand eine Software kennt, mit der man Robots erstellen kann, die dann alleine laufen, automatisch erkennen, wenn sich auf einer Seite etwas geändert hat, die Daten nach einem vorgegebenem Schema, das ich sehr einfach und leicht mit dieser SW selbst erstellen kann, parsen und dann als XML, oder gleich in die DB schreiben, dann bitte her mit den Tipps. :-)

Vielleicht ist es ja auch möglich eine FF-Extension zu erstellen aus einer Kombination von:
 - Selenium (http://www.openqa.org/selenium-ide/index.html)
 - XPather (http://xpath.alephzarro.com/)
und weiteren Erweiterungen.
Aber ist dies eigentlich so leicht realisierbar, wie ich mir dies vorstelle?

Für weitere Gedanken und Anregungen wäre ich euch sehr, sehr dankbar.

lg
Thomas