molily: mit RegExp alle Links auslesen, aber nicht die mit rel=nofollow

Beitrag lesen

Es soll ja für links passen die so:
<a href="xy.html" rel="nofollow">xy</a>
oder so:
<a rel="nofollow" href="xy.html">xy</a>
geschrieben sind.

Das kann in letzter Konsequenz nur ein echter HTML-Parser berücksichtigen, der dir eine Schnittstelle wie z.B. das DOM anbietet.
Sind das nur eigene oder beliebige HTML-Dokumente, die du da verarbeitest?

Mathias