K@rl: Mustererkennung in Texten - Textblöcke separieren

Beitrag lesen

Hallo Bruno

Nicht von dieser Welt Italien  1999  100'  R: Giuseppe Piccioni D: Margherita Buy, Silvio Orlando, Carolina Freschi

Brot und Tulpen Italien  2000  F  118'  R: Silvio Soldini D: Licia Maglietta, Bruno Ganz, Giuseppa Battiston

Ayurveda D/Indien  2000  F  102'  R: Pan Nalin Der Film bietet eine intensive und sehr sinnliche Reise...

Jede Zeile ist ein element in einem Array? wenn ja + sagen wir, es ist das Array @a, dann erst mal einen String draus machen:

my $s = join('', @a);

dann Splitten mit mindestens zwei Leerzeilen als Seperator:

my @splitted = split(/\n\n+/, $s); oder kompakter: my @splitted = split(/\n\n+/, join('', @a));

in @splitted steht jetzt jeweils ein Block als String (also mit Zeilenumbrüchen), also:

$splitted[0] ist: "Brot und Tulpen Italien  2000  F  118'  R: Silvio Soldini D: Licia Maglietta, Bruno Ganz, Giuseppa Battiston" (sollte zumindest sein ;)

das kannst du dann weiter splitten z.B.

my @item_splitted = split(/n/, $splitted[$i]); z.B. $item_splitted[1] ist dann "Italien  2000  F  118'  R: Silvio Soldini"

Mit einem herzlichen RTFM! (man perlfunc)

K@rl