Michael Schröpl: Links auslesen ?

Beitrag lesen

Gibt es eine Software, mit der man die Links einer Webseite auslesen kann und ohne jegliche  HTML-Tags geliefert bekommt ?

Es gibt einen fertigen Perl-Modul, der das macht:

NAME

HTML::LinkExtor - Extract links from an HTML document

SYNOPSIS

require HTML::LinkExtor;
$p = HTML::LinkExtor->new(&cb, "http://www.sn.no/";);
sub cb {
     my($tag, %links) = @_;
     print "$tag @{[%links]}\n";
}
$p->parse_file("index.html");