Nur wenn ich das zu behandelnde Material und das Ziel sehe.
Daran soll es nicht scheitern.
<h1 id="post-304455"><a href="blub" rel="bookmark" title="Permanent Link to blablub"><font color="black"><b>atom rofl lol</b></font></a> </h1>
<p class="date">Sonntag, 13. Juni 2010 11:07   <a href="http://twitter.com/" title="Click to send this page to Twitter!" target="_blank"><img src="http://picload.org/image/rdrclw/twittereus0.jpg" style="border: 0pt none;margin: 0px"></a></p>
<div class="entry"><!-- the entry -->
<p>bla bla bla blub ba dasfja sfweah falkshfailwefh asdfa</p>
<p><img src="http://www.google.com/intl/de_de/lovefootball/doodle4google/img/doodles/9-doodle.jpg" alt="" /><br />
<strong>Dauer: </strong>1 min. | <strong>Format: </strong>DSA | <strong>Größe: </strong>4 MB | <a href="blub.htmö" target="_blank">blub</a><br />
Generell ist es eine schlechte Idee, mit REs auf HTML Code losgehen zu wollen. Dafür gibt es entsprechende Parser.
Problem ist, dass der Code nicht valide oder auch nur konsitent ist und die Parser sich regelmäßig verschlucken