EisFuX: regular expressions

Beitrag lesen

Hallo Götz!

Das einzige Muster bzgl. "Zitattext", das ich hier sehe wäre die ein/zwei oder drei Zeilen vor <i class="author"> zu nehmen.
Einen anderen Anhaltspunkt hast Du ja leider nicht.

Genau das war ja mein Problem: Kein definierter Anfang, sieht man einmal davon ab, dass jede Zeile mit zwei Leerzeichen beginnt.

Zieh doch erstmal die raus. Dann wird Deine Zitatdatei vermutlich schon um einiges kleiner.
Danach kannst Du ja schauen, wie Du die restlichen rausfiltern kannst.

Der FuX ist schlau und stellt sich dumm, bei mir ist's leider andersrum.

Auf die Idee bin ich noch gar nicht gekommen: Die komplizierten Zitate zuerst rausfiltern und danach die einfachen.