Daten aus einer HTML- Seite Extrahieren von Auge, 26.05.2016 18:28

Daten aus einer HTML- Seite Extrahieren

Auge 26.05.2016 18:28

html
php

Hallo

das ist keine gute Idee, HTML ist nicht regulär und deshalb sind Regexp nicht der beste Weg es zu handhaben; verwende besser einen HTML/XML-Parser

Alternativ hatte ich mir ja schon den "Simple HTML DOM Parser" angeschaut, leider ist die HTML jedoch nicht valide, hat aber zumindest immer genau die gleiche Struktur für quick and dirty.

Dass der HTML-Code nicht valide ist, sollte den von woodfighter vorgeschlagenen Parser nicht stören. Wenn der Code zudem immer gleich falsch ist, sollte dein Regelwerk, welche Elemente als Kinder bestimmter anderer Elemente zu finden sind, funktionieren.

Zitat aus der von woodfighter verlinkten Doku-Seite: „The function parses the HTML contained in the string source. Unlike loading XML, HTML does not have to be well-formed to load.“

Tschö, Auge

--
Wo wir Mängel selbst aufdecken, kann sich kein Gegner einnisten.
Wolfgang Schneidewind *prust*

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Auge: Daten aus einer HTML- Seite Extrahieren

Beitrag lesen

Daten aus einer HTML- Seite Extrahieren

Daten aus einer HTML- Seite Extrahieren