Bruno: Mustererkennung in Texten - Textblöcke separieren

Beitrag lesen

hallo liebe forumgemeinde und perl freaks,

ich lese nun schon sehr lange in diesem forum und habe hier schon oft interessante problemlösungen gefunden.
heute allerdings möchte ich euch das erste mal bitten mir zu helfen - ich habe im moment eine kleine "hirnblockade" :)

das problem:
mein script liesst ein word-dokument per OLE aus und stopft den inhalt in ein array.
wenn ich mir dieses array mittels "foreach" ansehe, dann sieht es so aus, wie der auszug weiter unten.

ich möchte jetzt die einzelnen textblöcke weiter verarbeiten.
also jeder dieser blöcke hat eine überschrift und eine beschreibung.
getrennt werden die blöcke mit leerzeilen, manchmal auch einige hintereinander (im beispiel zu sehen).

kann mir bitte jemand eine kleine routine zeigen (oder ansatzpunkte), welche mir block für block zur weiterverarbeitung zur verfügung stellt?
wichtig ist, das die leerzeilen sauber erkannt und als trenner benutzt werden.

in den übergebenen blöcken sollen dann allerdings keine leerzeilen mehr sein.

für eure hilfe möchte ich mich jetzt schon bedanken!!!

viele grüße,
bruno

------------------------------------------------------------------
Nicht von dieser Welt
Italien  1999  100'  R: Giuseppe Piccioni
D: Margherita Buy, Silvio Orlando, Carolina Freschi

Brot und Tulpen
Italien  2000  F  118'  R: Silvio Soldini
D: Licia Maglietta, Bruno Ganz, Giuseppa Battiston

Ayurveda
D/Indien  2000  F  102'  R: Pan Nalin
Der Film bietet eine intensive und sehr sinnliche Reise...

Mio, mein Mio
SU/Schweden/Norwegen  1987  F  95'
Phantasievoll und spannend sind die Abenteuer, die der 9jährige...
------------------------------------------------------------------