Gast: Wortzeichen in regulären Ausdrücken

Zitat:
\w Word character Ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] (und evtl. weitere Buchstaben, z. B. Umlaute)

Wie stellt man ein, dass \w Umlaute beinhaltet oder noch allgemeiner, dass auch é, è, ê, also französische Buchstaben, dazugehören?

  1. gudn tach!

    Zitat:
    \w Word character Ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] (und evtl. weitere Buchstaben, z. B. Umlaute)

    Wie stellt man ein, dass \w Umlaute beinhaltet oder noch allgemeiner, dass auch é, è, ê, also französische Buchstaben, dazugehören?

    das liegt an den "locale"-einstellungen.[1] und weil die je nach umgebung mal so und mal so eingestellt sind oder man vergisst, sie einzustellen, empfehle ich, auf \w einfach komplett zu verzichten und stattdessen (entweder striktes [a-z] oder eben) gleich richtiges unicode-gedoens zu verwenden, z.b. \p{L}.[2,3]

    [1] vgl. perllocale
    [2] vgl. perluniprops
    [3] vgl. perlunicode

    prost
    seth

    1. Hi

      Zitat:
      \w Word character Ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] (und evtl. weitere Buchstaben, z. B. Umlaute)

      Wie stellt man ein, dass \w Umlaute beinhaltet oder noch allgemeiner, dass auch é, è, ê, also französische Buchstaben, dazugehören?

      [1] vgl. perllocale
      [2] vgl. perluniprops
      [3] vgl. perlunicode

      Hätte die Frage wohl besser unter PHP gestellt, da ich PHP verwende und mit den Perl-Dokumenten nichts anfangen kann.
      Grüße

      1. Om nah hoo pez nyeetz, Gast!

        Hätte die Frage wohl besser unter PHP gestellt, da ich PHP verwende und mit den Perl-Dokumenten nichts anfangen kann.

        PCRE-Suchmuster (php-Handbuch)

        Matthias

        --
        Der Unterschied zwischen Java und JavaScript ist größer als der zwischen Ball und Ballast.

      2. gudn tach!

        Hätte die Frage wohl besser unter PHP gestellt, da ich PHP verwende und mit den Perl-Dokumenten nichts anfangen kann.

        da sich die regexp-engines der grossen sprachen gegenseitig fast alles abschauen und da ausserdem die regexp-syntax von perl und php extrem aehnlich ist (bei php ist sie etwas komplizierter, weil man das nervige doppelte quoting zu beruecksichtigen hat), sollte das perl-manual hier eigentlich weiterhelfen.

        vgl. perlunicode mit http://www.php.net/manual/regexp.reference.unicode.php.

        prost
        seth