Liebe Gemeinde,
ich hätte da eine Verständnisfrage zum Parsen von HTML-Code mittels XPath. Angenommen, ich hätte ich eine Struktur wie die folgende:
<div id="Text">
Dies ist Satz 1.
<p>Dies ist Satz 2.</p>
Dies ist Satz 3.
<div id="Box">Satz 4 gehört nicht zum Text.</div>
</div>
Wie schaffe ich es dann KORREKTERWEISE, die Sätze 1 und 3 als auch Satz 2 zu erfassen, aber bspw. nicht Satz 4. In der Praxis scheint zwar
//div[@id="Text"]/p
für alle drei Sätze zu funktionieren. Aber sollte es das auch? Bzw. wie käme ich nur an die Sätze 1 und 3 heran? Ich hätte jetzt Folgendes gesagt, aber das funktioniert nicht (liefert überhaupt nichts zurück):
//div[@id="Text"]/text()
Danke!
Bob