Hi,
Ich habe einen Text und möchte ihn in Sätze zerlegen. Eigentlich sollte das anhand des Punktes ja leicht möglich sein, aber blöderweise kommen Punkte auch noch an vielen anderen Stellen, außer nur am Satzende vor.
Eben, und deshalb lässt sich das Problem gar nicht so leicht algorithmisch erfassen.
Beispiel:
"George W. Bush und Papst Benedikt XVI. haben sich am 5. Januar zum Tee verabredet. 25.700 Menschen sahen vom Petersplatz aus zu, bzw. beschäftigten sich mit kleinen Spielchen. So sprangen viele z.B. um genau 15.20 Uhr in die Luft."
Du könntest zunächst mal verlangen, dass es nach dem Punkt (und Leerzeichen) mit einem gross geschriebenen Wort weitergehen muss.
Damit hast du aber in deinem Beispiel den zweiten Satz nicht angefangen, der mit einer Ziffer beginnt. Könnte man auch noch als Satzanfang definieren - aber dann bekommst du auch wieder Probleme, wenn nach einem Punkt wie dem vom Papst direkt eine Zahl in Ziffernschreibweise folgen würde ...
Kurz: Du bräuchtest einen Algorithmus, der (deutsche) Grammatik versteht.
MfG ChrisB
“Whoever best describes the problem is the person most likely to solve the problem.” [Dan Roam]