dr.Colossos: html-Dokumentstruktur

Beitrag lesen

Hi,

evtl. hilft dir dieser Code, er erstellt aus einem HTML-String ($string) ein array aus Tags.

$pattern = '/(<(?:[^<>]+(?:"[^"]*"|'[^']*')?)+>)/';
// regex stammt nicht von mir, hab ich vor Monaten mal online gefunden, Quelle hab ich eben nicht mehr gefunden ...

// whitespace erstmal durch blanks ersetzen ...
$string = preg_replace('/(\s+)/', ' ', $string);

// ... dann string in in tokens teilen
$tokens = preg_split($pattern, trim($string), -1,
PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_NO_EMPTY);

Eingabe:
<html><head id="none2"></head><body id="none"></body></html>

Ausgabe:
$tokens[0] = "<html>";
$tokens[1] = "<head id="none2">";
$tokens[2] = "</head>";
$tokens[3] = "<body id="none">";
$tokens[4] = "</body>";
$tokens[5] = "</html>";

Might be helpful ...