Hi,
Hi, ich versuche gerade alle h tags also Überschriften aus dem Quellcode einer Seite per einem regex in PHP zu ermitteln.
Leider funzt das ganze noch nicht so, wie es soll. Bei manchen Seiten klappts, bei anderen nicht.
Das ist was ich soweit habe:
preg_match_all('#<h\d{1}\s*.*>(\s*\w*-*.*\s*)*</h\d{1}>#i', $string, $result);
#<h\d{1}\s*
Bis hierhin sollte es ok sein. Wobei ich '*' durch '?' ersetzen wuerde.
.*
Hier suchst soviele beliebige Zeiche wie moeglich. Wobei '.' auch das > miteinschliest. Stichwort gieriges Verhalten.
Sollte wieder passen.
(\s*\w*-*.*\s*)*
Was du hier vorhast weiss ich nicht.
</h\d{1}>#
Passt wohl auch wieder.
mfG,
steckl