regexphater: mit Regular Expression HTML-Output modifizieren

Hallo,

für den PDF-Output einer HTML-Seite übergebe ich den content von ob_get_contents (also den generierten HTML-Output) an einen Converter, der mir daraus ein pdf erstellt - funktioniert so weit ganz gut!

Doch jetzt muss ich bestimmte Stücken aus dem HTML-Code rausschneiden, also habe ich bei der Generierung des Codes einen bestimmten comment-tag um die Stückchen drumrumgeschrieben, den ich nun rausfiltern will

der code sieht circa so aus.

...  
<tr>  
<!--qstart--><td class='left'>question1</td><!--qend-->  
<td class='balken'><div class='mittel_summe'>23</div></td>  
<td>yet another td</td>  
</tr>  
<tr>  
<!--qstart--><td class='left'>question2</td><!--qend-->  
<td class='balken'><div class='mittel_summe'>42</div></td>  
<td>yet another td</td>  
</tr>  
...

wobei die jeweilige tabellenzellen, die mit den <!--qstart--><!--qend--> eingerahmt sind entfernt werden sollen

leider stehe ich mit regexp auf kriegsfuss, die sind mir einfach zu abstrakt, also komme ich nach

$suchmuster = '<!--qstart-->(.*)<!--qend-->';  
$pdf_output = preg_replace($suchmuster, " ", $html_body);

nicht weiter

kann mir jemand helfen, und die regexp geben, mit der ich diese Zellen entfernen kann?

danke schonmal im vorraus

  1. leider stehe ich mit regexp auf kriegsfuss, ...

    $suchmuster = '<!--qstart-->(.*)<!--qend-->';

    Das ist doch kein Suchmuster, das ist etwas, was durch einen festen String eingeleitet und durch einen festen String abgeschlossen wird. Dann nimm doch einfach Stringfunktionen. strpos und substr in einer while-Schleife bieten sich an.

  2. Hallo,

    kann mir jemand helfen, und die regexp geben, mit der ich diese Zellen entfernen kann?

    Versuch's mal damit:

    $suchmuster = '/<!--qstart--.*?-->/';

    Gruß, Don P

  3. oder vielleicht doch besser so:

    $suchmuster = '/<!--qstart--(.*)?-->/';

    Gruß, Don P