Hallo
das ist keine gute Idee, HTML ist nicht regulär und deshalb sind Regexp nicht der beste Weg es zu handhaben; verwende besser einen HTML/XML-Parser
Alternativ hatte ich mir ja schon den "Simple HTML DOM Parser" angeschaut, leider ist die HTML jedoch nicht valide, hat aber zumindest immer genau die gleiche Struktur für quick and dirty.
Dass der HTML-Code nicht valide ist, sollte den von woodfighter vorgeschlagenen Parser nicht stören. Wenn der Code zudem immer gleich falsch ist, sollte dein Regelwerk, welche Elemente als Kinder bestimmter anderer Elemente zu finden sind, funktionieren.
Zitat aus der von woodfighter verlinkten Doku-Seite: „The function parses the HTML contained in the string source. Unlike loading XML, HTML does not have to be well-formed to load.“
Tschö, Auge
Wo wir Mängel selbst aufdecken, kann sich kein Gegner einnisten.
Wolfgang Schneidewind *prust*