Andreas Dölling: RegExp: \b matcht auch Umlaute?

Beitrag lesen

Hallo,

ist es richtig, daß \b auch Umlaute als Wortgrenze macht?
Wenn ja: was kann man dagegen tun?
Ich habe in einem Text (UTF-8) das Wort "Geräte". Den Text will ich in zwei Hälften teilen.
Dazu verwende ich diesen Ausdruck:
preg_match("/^(.{0,".(strlen($contents)/2+20)."})(?:\b)(.*)$/sm", $contents, $matches);

Das klappt auch ganz wunderbar - $matches[1] enthält die erste Hälfte, $matches[2] die zweite, wobei normalerweise kein Wort zerschnitten wird.
Bei dem Text mit dem Wort "Geräte" allerdings steht dieses Wort am Ende der ersten Hälfte und wird nach dem "ä" abgeschnitten, anstatt daß das tatsächliche Wortende oder das Ende des vorhergehenden Wortes benutzt wird.

Hattet Ihr mit diesem Problem schon zu tun? Wie habt Ihr es gelöst?

Thanx und ciao,
Andreas

--
"Das Corporate Design für das Internet sieht eine Reihe von Grafikelementen vor, die die Optik der Webseite visuell und funktionell beeinflussen." - (Zitat aus dem "Styleguide Corporate Design"  eines großen Konzerns...)