Moin!
Das geht leider nicht immer. Gerade in regulären Ausdrücken gibt es da Probleme. Gibt's denn keine Syntax zum Einfügen eines UTF-8 Zeichens per Hex-Wert in einen UTF-8 String? So primitiv kann PHP < 6 doch nicht sein.
Doch, ist es. Unicode in regulären Ausdrücken erfordert immer irgendeine Sonderbehandlung - abhängig von der Funktion, die verwendet wird.
UTF-8-Zeichen sind in PHP-Strings immer eine Aneinanderreihung eines oder mehrerer Bytes. Dementsprechend funktioniert beispielsweise sowas als Regex nicht einfach: "[a-zäöüß]". Für preg_*-Funktionen gibt es aber beispielsweise den Modifikator u, der Suchmuster als UTF-8 behandelt. Außerdem ist in diesem Modus der Pattern \x{FFFF} möglich, um den Unicode-Codepoint hexadezimal anzugeben - aber eben NUR im regulären Ausdruck, nicht allgemein in allen Strings.
Alternativ existiert auch mb_ereg().
- Sven Rautenberg
"Love your nation - respect the others."