Michael: h tags per regex ermitteln

Beitrag lesen

Hi, ich versuche gerade alle h tags also Überschriften aus dem Quellcode einer Seite per einem regex in PHP zu ermitteln.

Leider funzt das ganze noch nicht so, wie es soll. Bei manchen Seiten klappts, bei anderen nicht.

Das ist was ich soweit habe:

preg_match_all('#<h\d{1}\s*.*>(\s*\w*-*.*\s*)*</h\d{1}>#i', $string, $result);

$string ist der Quelltext einer Seite
$result sind die Treffer (array)

Woran könnte das liegen, was stimmt am regex nicht?

Wäre nett, wenn mir jemand von euch weiterhelfen könnte.

Michael