ich versuche ein HTML Dokument mit RegEx zu parsen
html oder xhtml?
wenn du zb ein wohlgeformtes xhtml-dokument hast, kannst du das ganze relativ problemlos mit einem xml-parser lesen - das ist wesentlich effizienter als mit einem tagsoup-parser zu arbeiten