Jannes: mit RegExp alle Links auslesen, aber nicht die mit rel=nofollow

Beitrag lesen

Hallo zusammen,

wie schon im Betreff zu lesen ist, möchte ich alle Links aus einem HTML-Body auslesen. Das mache ich momentan so:

preg_match_all('/<a.*?href='"['"].*?</a>/msi', $body, $links);

Ich möchte aber keine Links in den Treffern haben die ein rel=nofollow beinhalten. Wie kann man das mit in den RegExp-Ausdruck bringen? Es soll ja für links passen die so:
<a href="xy.html" rel="nofollow">xy</a>
oder so:
<a rel="nofollow" href="xy.html">xy</a>
geschrieben sind.

Gruß,
Jannes