seth: regex: Link Extractor

Beitrag lesen

gudn tach!

habe nun einen funktionierenden regex zu stande gebracht:
$regex="/<a href="(.*?)".*?>(.*)</a>/i";
Was aber noch fehlt, ist der Fall, dass jemand statt href="" evt. href='' oder href=http... schreibt.
(Wie) könnte man das auch noch berücksichtigen?

in perlsyntax sowas:
  /<a href=(["']?)([^ ]*)\1.*?>(.*)</a>/i

in php, was du vermutlich benutzt, muesstest du halt noch die string-delimiter maskieren. erklaerung bekommst du im perl- oder php-manual unter dem stichwort "backreferences".

beachte aber, dass damit z.b. in href=... kein leerzeichen enthalten sein darf.

prost
seth