Hallo Struppi!
HTML::Parser.
Was kann das Modul denn alles? Ich habe im Script bisher nur 4 Suchen/Ersetz-Zeilen:
Aus Anker-Links sollen Nummerierungen werden (<a href="#a1">Verweis</a> wird zu 1. Verweis und das entsprechende <a name="a1">Ankertext</a> wird zu <b>1. Ankertext</b>). Dann werden die Links im Fließtext durch deren Text ersetzt (war ja die Urprungsfrage des Postings) und bei der einen oder zwei Seiten, die ein <form>-Tag beinhalten, soll das (evtl... - ich überlege gerade noch was) ganz weg. Sonst bleibt alles wie es ist (alle <p>, <span> u.a. bleiben).
Die Lösung von Christian mit der anderen Art der Datei einzulesen ist nicht umsonst gewesen, denn die werde ich wie erwähnt für das Archivieren der Forumsdateien brauchen. Nur, die probiere ich ein anderes Mal, ich muss sehen, dass ich vorwärts komme - denn eigentlich hätte der Relaunch von AE am 27.08. stattfinden sollen :)
Viele Grüße aus Frankfurt/Main,
Patrick