Jannes: RegExp entfernen alle nicht Wortzeichen, ausser Bindestrich

Beitrag lesen

Hallo zusammen,

da sind sie wieder, die Regulären Ausdrücke, (uuäähh). Ich habe eine Textmenge, die bis hier perfekt für meine Zwecke (das indexieren aller einzelnen Wörter) vorbereitet ist. Nur alle Nichtwort-Zeichen sollen noch raus:
preg_replace('/\W+/',' ',$text)

Hhm, nein, doch nicht alle! Das - (Minuszeichen/Bindestrich) möchte ich behalten. Anstelle des Versuchs, alle evtl. vorkommenden Nichtwortzeichen in mir unbekannten Texten z.B. per str_replace zu entfernen und so den - stehen zu lassen, möchte ich die wissenden Forumsteilnehmer bitten mir zu sagen ob _das_ geht. Andere Ansätze funktionieren leider nicht, das habe ich schon gelernt. Aber hier keimt doch ein beachtenswerter Hoffnungsschimmer in mir ;-)

Gruß,
Jannes