Jannes: mit RegExp alle Links auslesen, aber nicht die mit rel=nofollow

Beitrag lesen

Hi,

Dafür findet es auch Nichtlinks, z.B.:
<a name="bla">blubb</a>

jaja, href= muß schon mit drin sein, (soweit war ich schon).

Also, ich habs jetzt so gemacht:
preg_match_all('/(<a.*?href=['"].*?['"].*?</a>)/msi', $page, $links);
foreach($links[1] as $a)
{
if(preg_match('/rel=["']nofollow/i',$a))
{
continue;
}
if(!preg_match('/href='"['"]/i', $a, $link))
{
continue;
}
$a = $link[1];

...  

Das ist vielleicht nicht so performant, aber da die Datei eh nur 1-2 mal im Monat laufen soll ist mir das egal. Und es hat den Vorteil das ich verstehe was passiert ;-)

Gruß,
Jannes