Hallo.
Ich möchte aus dem HTML Quellcode einer Seite ein paar Links extrahieren, indem ich alle Zeichen außer den den Links lösche.
Dazu möchte ich die Suchen-und-Ersetzen-Funktion von JEdit unter mithilfe von regulären Ausdrücken verwenden.
Die Syntax der Links, die ich haben möchte, sieht in etwa so aus (ohne Delimeter):
"http://seite.*"
Ich suche also alle Links die mit einem Anführungszeichen beginnen dann mit http://seite weitergehen, dann beliebig viele verschiedene Zeichen enthalten und schließlich wieder mit einem Anführungszeichen enden.
Probiert hatte ich folgendes:
[^"http://seite.*"] - also alles, was nicht diesem Link entspricht durch nichts ersetzen und somit löschen.
Allerdings sind die Ausdrücke wohl "gierig" und hören erst beim letzten Anführungszeichen in der Zeile auf. In SELFHTML habe ich gefunden, dass man nun hinter den Ausdruck ein Fragezeichen setzen soll, damit die Ausdrücke genügsam sind:
[^"http://seite.*"]?
[^"http://seite.*"?]
Sowohl die erste als auch die zweite Variante bringen nicht das erwünschte Ergebnis, sondern es werden alle Zeichen nach dem ersten Anführungszeichen gelöscht. Interpretiert JEdit das Fragezeichen anders?
Bitte helft mir, die Links zu extrahieren.
Mfg, Glory