Hallo,
ich habe ein kleines Problem beim Erstellen eines regulären Ausdrucks. Er soll folgendes tun:
Gegeben ist der HTML Quellcode einer Seite darin sind Spans enthalten, die über IDs identifiziert werden können.
Zum Beispiel:
<span id="titel001">xxx</span>
Mehr Text, der ignoriert werden soll.
<span id="beschreibung001">yyy</span>
und so weiter, mit immer anderen, durchnummerierten IDs.
Nun soll der Ausdruck den Inhalt des ersten Spans suchen, und den Inhalt des DAZUGEHÖRIGEN zweiten Spans (also mit der gleichen Nummer in der ID) dazu.
Der erste Teil des Ausdrucks, also das Finden des Inhalts des ersten Spans ist denkbar einfach:
<span id="titel(\d+)">(.*?)</span>
Aber wie kann ich den weiteren Teil so aufbauen, dass er prüft, ob die ID gleich der bereits gefundenen ist?
Zum Beispiel:
<span id="titel(\d+)">(.*?)</span>.*<span id="beschreibung(HIER MUSS DIE VORNE GEFUNDENE ID PASSEN)">(.*?)</span>
Hat da jemand eine Idee? Ich erinnere mich dunkel, dass man irgendwie auf die benutzte Klasse referenzieren konnte, kriege den Syntax aber nicht mehr zusammen.