Liebe Mitdenker, liebe Wissende, liebe Neugierige,
damit ich schon mal eine Teillösung abliefern kann:
Einen Bereich (eine Node samt Subnodes) aus einem HTML-Dokument auszuschneiden, geht absolut einfach, wenn man diese eine ID hat:
## file_get_contents() nur für den Test, ich bevorzuge sonst explizite
## File-Dialoge mit Fehlerbehandlung und Sperren
$text = file_get_contents('standard.html');
$dom = new DOMDocument('1.0', 'utf-8');
$dom->formatOutput = TRUE;
$dom->validateOnParse = TRUE;
$dom->normalizeDocument();
$dom->preserveWhiteSpace = true;
$dom->loadHTML($text);
$table = $dom->getElementById('t001');
## "to-string"-Methode für HTML
$out = $dom->saveHTML($table);
echo "<pre>\r\n";
echo htmlspecialchars($out);
echo "</pre>\r\n";
Die Schwierigkeit liegt einzig und alleine darin, die richtige Node zu finden. Da fehlen mir einfach noch die Ideen, wie man die besser eingrenzen kann:
- direkte Nachbarn (Parent, Siblings, Children)
- Attribute (id, classes, ...)
- Textinhalte
- ???
Freue mich über Anregungen.
Spirituelle Grüße
Euer Robert
robert.r@online.de
--
Möge der wahre Forumsgeist ewig leben!
Möge der wahre Forumsgeist ewig leben!