Holla,
Bisher habe ich das immer von Hand gemacht: Im Browser die Linkliste abgearbeitet, Seiten aufgerufen, gespeichert, später dann die HTML-Tags mit einem Perl-Skript entfernt und die Texte in eine Datei hintereinander gepackt. Das Ganze steht mir noch fünf- oder sechsmal bevor, so dass ich dachte: Das müsste man doch automatisieren können.
Ich denke das ganze lässt sich ziemlich leicht mit LWP:Simple realisieren , damit lädst Du quasie die HTML seite in den Speicher, bearbeitest diese ( das Script hast Du je bereits ) und speicherst es , fertig ;)
Als Anfang:
use LWP::Simple;
my $webseite = get('http://www.google.de');
Damit hast Du den Quelltext in $webseite und der Rest wird dann auch sicher langsam vorangehen oder ? ;)
Ansonsten: http://www.cpan.org da werden sie geholfen ;)
MfG
AndreasN