Erik Tews: Text in Wörter aufteilen

Beitrag lesen

Hi

Ich hab folgendes Problem. Ich hab einen Text und will ihn in einzelne Wörter aufteilen. Ohne Satzzeichen und sonstwas. Das Problem ist, dass dort auch URLs vorkommen können. Also bringt es z. B. nichts, wenn man einfach nach / / splittet, und dann alle Satzzeichen rausfiltert. In nem URL kommt ja auch nen Doppelpunkt vor. Ich hab schon mal hier eine Regex gefunden, die einen Text in Wörter aufteilen soll, aber das ging nicht so einwandfrei. Vielleicht kann mir da jemand nen Parameter für Split nennen. Ein Text könnte so aussehen:

Wenn sie noch mehr Informationen über unser Projekt erfahren wollen, dann besuchen sie unsere Webseite http://www.irgendwas.de oder mailen sie an mail@irgendwas.de.

Hat jemand ne Idee, wie ich daraus was machen könnte wie:

Wenn
sie
noch
mehr
über
unser
Projekt
erfahren
wollen
dann
besuchen
sie
unsere
Webseite
http://www.irgendwas.de
oder
mailen
sie
an
mail@irgendwas.de