Jannes: mit RegExp alle Links auslesen, aber nicht die mit rel=nofollow

Beitrag lesen

Hi,

Das kann in letzter Konsequenz nur ein echter HTML-Parser berücksichtigen, der dir eine Schnittstelle wie z.B. das DOM anbietet.
Sind das nur eigene oder beliebige HTML-Dokumente, die du da verarbeitest?

Ausgangspunkt war, die eigene Seite mit einer komfortablen und kontrollierbaren Suchfunktion auszustatten, aber der Anspruch ist gewachsen. Nach Möglichkeit wäre es auch schön, wenn man beliebige (kleine) Seiten oder Seitenzweige scannen könnte.

Gruß,
Jannes