Hallo WauWau
Wieso nicht selber bauen? Self ist die Devise ;-)
Da ich oft Seiten parse, die oft unsauber entwickelt wurden hab ich zugegebenermaßen etwas frust :( Bspweise könnte man Links auch so formulieren
<A href=x.html>xxx<a href='irgendwas.htm'>yyy</A>
d.h. beim ersten gibts kein End-Tag, was "egal" ist, weil der letzte Link geschlossen wird, dann gibts die Variante ganz ohne " und dann auch nur ' - Und dann geht das schon wieder nicht mehr *schluchz* :-( Hab desshalb nach einer RegEx gesucht die bereits all diese Grausamkeiten abdeckt. Eigentlich würde ich das ganze ja überhaupt nicht mit RegEx machen sondern mit einem SAX bzw. XML Dom Parser. Da sich aber viele Seiten trotz XML Make-Tidy Tool nicht in ein XML Format bringen lassen, such ich eben den Ausweg über RegEx...
trotzdem danke!
dominik