Siechfred: Regex: bestimmte Links aus Quellcode extrahieren

Beitrag lesen

Aber wie wirft man alles raus, was nicht "bla" ist?

Mal auf den Ausgangsfall gemünzt (Perl-Syntax):

my $text = '<h1>Ueber</h1><p style="foo">foo<em>bar</em><br>baz<strong>bum!</p>';  
print $text, "\n";  
$text =~ s/<(?!\/?(br|p)).+?>//ig;  
print $text;

Fehlt nur noch die Ersetzung für die unerwünschten Attribute. Eleganter geht's natürlich immer :)

Siechfred