Liebe Mitdenker, liebe Wissende, liebe Neugierige,
Meine momentane Idee (Beispiel ADAC):
Ich lese die Seite als String ein und springe auf <div class="cb-head">. Von da an durchhangeln und geöffnete / geschlossene divs zählen.
Aber wenn man diesen Ast des "Baums" direkt greifen könnte, wäre natürlich toll.
Ich habe das, was ich vorhin für die EUROPA SERVICE Autovermietung gebaut hatte mal auf ADAC angewendet und man bekommt ohne weiteres die Daten:
<div class="content_box big">
<div class="cb-head">
<h4>ADAC e.V.</h4>
</div>
<div class="cb-content clearfix">
<div>Pannenhilfe und Fahrsicherheit zählen zu den Kernkompetenzen des ADAC.
Profitieren Sie auch als Geschäftspartner für Ihre Flotte von diesen
innovativen Dienstleistungen. Bei Panne oder Unfall in den besten Händen!
Die <b>ADAC Flotten Assistance</b> bietet schnelle und professionelle Hilfe in
ADAC Qualität. Gerade in Notsituationen können Sie Ihren Fuhrparkkunden
rund um die Uhr ein Paket an Mobilitätsleistungen anbieten; stets zu
kostengünstigen Pauschalen ohne Vorauszahlung.<br><br>Mit der
Teilnahme am ADAC Fahrsicherheitstraining erhöhen Sie die Fahrsicherheit
und tragen zur Reduzierung der Schadensquote bei. Treibstoffkosten sparen
und defensives Fahren erlernen Sie im ADAC Sprit-Spar- und Eco-Training.
Auch der Spaß kommt nicht zu kurz für Fun & Action Begeisterte
bieten wir außergewöhnliche Fahrerlebnisse an.<br><br>Wir freuen
uns über Ihren Besuch am ADAC Stand.
<br>
</div>
</div>
</div>
Die Umbrüche im Text habe ich eingesetzt und die Formatierung (Einrückungen) nachgebessert, um zu kontrollieren, ob auch alle Elemente vollständig vorhanden sind bzw. ergänzt werden (das passiert automatisch).
Man kann ohne weiteres bei <div class="content_box big">
aufsetzen.
Wenn Du erst bei <div class="cb-head">
anfängst, erhältst Du natürlich nur den Block
<div class="cb-head">
<h4>ADAC e.V.</h4>
</div>
Der nächste wäre ja ein Sibling und kein Child. Da müsstest Du dann in dem zu bauenden Tool in der X-Path-Übersicht zwei Startpunkte markieren.
Ich bastel heute noch an einem "getElementsByAttribs( array of attribs )"
Das ergibt dann eine DOMNodeList. Je mehr Attribs vorgabe sind, desto genauer werden die Nodes gefiltert.
Dann kann der Autor der Seite ruhig kleinigkeiten ändern, solange er die Elemente mit den Attributen drin lässt.
Spirituelle Grüße
Euer Robert
robert.r@online.de
Möge der wahre Forumsgeist ewig leben!