Michael Schröpl: tool zur aufzeichnung des html-codes einer website

Beitrag lesen

ich suche ein tool, das den html-quelltext einer oder mehrerer websites aufzeichnet und nach ein paar tagen dieses wieder tut und mit dem alten aufgezeichneten quelltext der website vergleicht und die veränderungen anzeigt, so dass man sieht, was sich genau an der site verändert hat.

Ich würde das folgendermaßen lösen:

a) Ein kleines Perl-Skript schreiben, das als Parameter die aufzuzeichnende URL und das Verzeichnis zum Speichern erhält. Das Skript liest mit LWP::Simple::get() den Inhalt der URL und speichert diesen im angegebenen Verzeichnis ab.

b) Ein Skript, welches zuerst das Programm aus a) und danach ein Vergleichswerkzeug (unter UNIX: "diff") aufruft, um die Unterschiede zu protokollieren (ggf. in eine Datei).
In diesem Skript kann man dann noch Automatisierungen vornehmen. (Beispiel: "Falls die Differenz nicht-leer ist, dann sende diese Differenz per E-Mail an mich.")

c) Den periodischen Aufruf dieses Skripts irgendwie automatisieren (hängt von Deiner Plattform ab, unter UNIX ist "cron" prima).

Realisierungsaufwand: Sollte an einem Tag locker zu schaffen sein.