regexphater: mit Regular Expression HTML-Output modifizieren

Beitrag lesen

Hallo,

für den PDF-Output einer HTML-Seite übergebe ich den content von ob_get_contents (also den generierten HTML-Output) an einen Converter, der mir daraus ein pdf erstellt - funktioniert so weit ganz gut!

Doch jetzt muss ich bestimmte Stücken aus dem HTML-Code rausschneiden, also habe ich bei der Generierung des Codes einen bestimmten comment-tag um die Stückchen drumrumgeschrieben, den ich nun rausfiltern will

der code sieht circa so aus.

...  
<tr>  
<!--qstart--><td class='left'>question1</td><!--qend-->  
<td class='balken'><div class='mittel_summe'>23</div></td>  
<td>yet another td</td>  
</tr>  
<tr>  
<!--qstart--><td class='left'>question2</td><!--qend-->  
<td class='balken'><div class='mittel_summe'>42</div></td>  
<td>yet another td</td>  
</tr>  
...

wobei die jeweilige tabellenzellen, die mit den <!--qstart--><!--qend--> eingerahmt sind entfernt werden sollen

leider stehe ich mit regexp auf kriegsfuss, die sind mir einfach zu abstrakt, also komme ich nach

$suchmuster = '<!--qstart-->(.*)<!--qend-->';  
$pdf_output = preg_replace($suchmuster, " ", $html_body);

nicht weiter

kann mir jemand helfen, und die regexp geben, mit der ich diese Zellen entfernen kann?

danke schonmal im vorraus