Jörk Behrends: Daten aus einer HTML-Seite auslesen

Beitrag lesen

Hi!

Aber mit der konkreten Aufgabenstellung, aus einer
auf eine ganz bestimmte Weise aufgebauten HTML-Datei
ganz bestimmte Informationen zu extrahieren, hat sie
so gut wie nichts zu tun.

Das ist ja so auch wieder nicht war. Man kann jetzt innerhalb der Funktion start davon ausgehen, wirklich nur start-Tags vor der Nase zu haben.
Dort wartet man auf ein bestimmtes Tag bzw. einen bestimmten Inhalt - kann dann ein Flag setzten, welches besagt, daß an anderer Stelle nach den Zielinhalt geschaut werden soll:

$drin = '' # entspricht 'false'
$scan-left = ''
$scan-right = ''
sub start {
wenn Tag = div und in den Attributen class = left, dann $scan-left=true
wenn Tag = div und in den Attributen class = right, dann $scan-right=true
}

sub end {
wenn Tag = div $scan-left = '' und scan-right = ''
}

sub text {
wenn $scan-right und $drin, dann $wert = Text und $drin = ''  # GEFUNDEN
wenn $scan-left und der Text enthält WKN dann $drin = true
}

Nur so als grober Ansatz. Wirkt relativ umständlich! Insbesondere im Vergleich zu einer RegExp. Aber dafür ist es "Tag-Konform" um bekommt keine Probleme, wie bei dem Kommentar-Beispiel ...

Gruß,
   Jörk