Hallo Verzweifelnder,
grundsätzlich würde ich für die Verarbeitung von Unicode die mb-Funktionen verwenden, also mb_ereg.
Bei einfachen Dingen, wo ein byteweise Arbeitsweise genügt, kann man auch die "klassischen" Stringfunktionen verwenden.
Aber gerade in deiner Regex, wo Du Zeichenklassen verwendest, ist mb_ereg eher angezeigt als preg_match. Es mag sein, dass ein preg_match mit u Option äquivalent ist zu mb_ereg, das weiß ich nicht. Aber wer Unicode verarbeitet, sollte möglichst vergessen, dass es die bytebasierenden Stringfunktionen überhaupt gibt.
Rolf
--
sumpsi - posui - obstruxi
sumpsi - posui - obstruxi