Hi,
Sie müssen ja nicht den Javascript-Code interpretieren, sie müssen nur ungefähr so eine Regexp verwenden:
Dir ist bekannt, wie rechenintensiv Regular Expressions sein können; insbesondere wenn man in Anbetracht einer gewissen Datenmasse auf Performance acht geben muss?
/document.writeln('(.+?)')/
document.write() gibt's auch. Abgesehen davon sind ohne weiteres Variablen darin möglich, die sich garantiert nicht mit einer RegExp erfassen lassen. Nein, hinter einer Programmiersprache steckt *wesentlich* mehr als hinter einer Markup Language.
Das ist doch nicht sooviel schwerer, als HTML-Tags rauszufiltern.
Okay, dann nimm Dir mal bitte auf diese Weise das Menü von http://www.quelle.de/ vor. Kann ja nicht so schwer sein, die Deeplinks der "Einkaufswelt" zu crawlen, oder?
Cheatah