woodfighter: Daten aus einer HTML- Seite Extrahieren

Beitrag lesen

Tach,

eine Lösung mit XPath könnte z.B. so aussehen:

$xpath = new DOMXpath(DOMDocument::loadHTML ($html));
$keys=$xpath->query("*/div[@class='content']//tr/th");
$cells=$xpath->query("*/div[@class='content']//tr/td");
$values[]=$xpath->query("*/div[@class='content']/img")->item(0)->getAttribute('src');

$i=0;
foreach($cells as $cell){
    $value[$keys->item($i%$keys->length)->nodeValue]=empty($cell->nodeValue) ? $cell->firstChild->getAttribute('src') : $cell->nodeValue;
    if($i%$keys->length==$keys->length-1){
      $values[]=$value;
      unset($value);   
    }
    $i++;
}

funktioniert (unter ähnlichen Annahmen wie LastBoyScouts Lösung), ist aber auch nicht schön.

mfg
Woodfighter