AndreasN: Anfängerfrage: Perl-Modul, um WWW-Seiten zu parsen

Beitrag lesen

Holla,

Bisher habe ich das immer von Hand gemacht: Im Browser die Linkliste abgearbeitet, Seiten aufgerufen, gespeichert, später dann die HTML-Tags mit einem Perl-Skript entfernt und die Texte in eine Datei hintereinander gepackt. Das Ganze steht mir noch fünf- oder sechsmal bevor, so dass ich dachte: Das müsste man doch automatisieren können.

Ich denke das ganze lässt sich ziemlich leicht mit LWP:Simple realisieren , damit lädst Du quasie die HTML seite in den Speicher, bearbeitest diese ( das Script hast Du je bereits ) und speicherst es , fertig ;)

Als Anfang:
use LWP::Simple;
my $webseite = get('http://www.google.de');

Damit hast Du den Quelltext in $webseite und der Rest wird dann auch sicher langsam vorangehen oder ? ;)
Ansonsten: http://www.cpan.org da werden sie geholfen ;)

MfG
AndreasN

--
Wer lesen kann ist klar im Vorteil