Gibt es eine Software, mit der man die Links einer Webseite auslesen kann und ohne jegliche HTML-Tags geliefert bekommt ?
Es gibt einen fertigen Perl-Modul, der das macht:
NAME
HTML::LinkExtor - Extract links from an HTML document
SYNOPSIS
require HTML::LinkExtor;
$p = HTML::LinkExtor->new(&cb, "http://www.sn.no/";);
sub cb {
my($tag, %links) = @_;
print "$tag @{[%links]}\n";
}
$p->parse_file("index.html");