LastBoyScout: Daten aus einer HTML- Seite Extrahieren

Beitrag lesen

Dank woodfighter`s Denkanstoß habe ich es zumindest schon mal geschafft die Tabellenwerte herauszufiltern:

$daten = new DOMDocument();
$daten->loadHTML($string);
$zeilen = $daten->getElementsByTagName('tr');
foreach ($zeilen as $zeile) {
    $felder = $zeile->getElementsByTagName('th');
    foreach ($felder as $feld) {
        $schluessel[] = $feld->nodeValue;
    }
    $felder = $zeile->getElementsByTagName('td');
    $nr = 0;
    foreach ($felder as $feld) {
        $wert[$schluessel[$nr++]] = $feld->nodeValue;
    }
    $werte[] = $wert;
}
print_r($werte);

Jetzt gibt es nur noch drei Probleme:

  1. Wie kann ich es auf das div mit class="content" begrenzen?
  2. Wie komme ich an die URL des Gesamtbild?
  3. Wie komme ich an die URL`s der Einzelbilder (hier liefert mein Script nur leere Felder)?