Wortzeichen in regulären Ausdrücken
Gast
- programmiertechnik
Zitat:
\w Word character Ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] (und evtl. weitere Buchstaben, z. B. Umlaute)
Wie stellt man ein, dass \w Umlaute beinhaltet oder noch allgemeiner, dass auch é, è, ê, also französische Buchstaben, dazugehören?
gudn tach!
Zitat:
\w Word character Ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] (und evtl. weitere Buchstaben, z. B. Umlaute)Wie stellt man ein, dass \w Umlaute beinhaltet oder noch allgemeiner, dass auch é, è, ê, also französische Buchstaben, dazugehören?
das liegt an den "locale"-einstellungen.[1] und weil die je nach umgebung mal so und mal so eingestellt sind oder man vergisst, sie einzustellen, empfehle ich, auf \w einfach komplett zu verzichten und stattdessen (entweder striktes [a-z] oder eben) gleich richtiges unicode-gedoens zu verwenden, z.b. \p{L}.[2,3]
[1] vgl. perllocale
[2] vgl. perluniprops
[3] vgl. perlunicode
prost
seth
Hi
Zitat:
\w Word character Ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] (und evtl. weitere Buchstaben, z. B. Umlaute)Wie stellt man ein, dass \w Umlaute beinhaltet oder noch allgemeiner, dass auch é, è, ê, also französische Buchstaben, dazugehören?
[1] vgl. perllocale
[2] vgl. perluniprops
[3] vgl. perlunicode
Hätte die Frage wohl besser unter PHP gestellt, da ich PHP verwende und mit den Perl-Dokumenten nichts anfangen kann.
Grüße
Om nah hoo pez nyeetz, Gast!
Hätte die Frage wohl besser unter PHP gestellt, da ich PHP verwende und mit den Perl-Dokumenten nichts anfangen kann.
PCRE-Suchmuster (php-Handbuch)
Matthias
gudn tach!
Hätte die Frage wohl besser unter PHP gestellt, da ich PHP verwende und mit den Perl-Dokumenten nichts anfangen kann.
da sich die regexp-engines der grossen sprachen gegenseitig fast alles abschauen und da ausserdem die regexp-syntax von perl und php extrem aehnlich ist (bei php ist sie etwas komplizierter, weil man das nervige doppelte quoting zu beruecksichtigen hat), sollte das perl-manual hier eigentlich weiterhelfen.
vgl. perlunicode mit http://www.php.net/manual/regexp.reference.unicode.php.
prost
seth