Gustav Gans: Das nächste regex-Problem

Beitrag lesen

Hi,

jedenfalls von UTF-8 nicht, wenn man nicht den passenden Modifizierer angibt.

ich nehme an, auf der von Dir verlinkten Seit emeinst Du den Modifikator u (PCRE_UTF8) mit der Erklärung:

Dieser Modifikator schaltet mit Perl nicht kompatible zusätzliche PCRE-Funktionalität an. Suchmuster werden als UTF-8 behandelt. Dieser Modifikator steht unter Unix seit PHP 4.1.0 und unter Win32 seit PHP 4.2.3 zur Verfügung. Ob es sich im Suchmuster um gültiges UTF-8 handelt, wird seit PHP 4.3.5 überprüft.

Was immer das jetzt auch heißen mag... :-) ...wenn ich aus meinem

/[§%&'<>#¡¢£¤¥¦©ª«¬®=/¯°²³´µ¶·¸¹º»¼½¾¿×÷]+/

jetzt ein

/[§%&'<>#¡¢£¤¥¦©ª«¬®=/¯°²³´µ¶·¸¹º»¼½¾¿×÷]+u/

mache, dann ist das Phenomen verschwunden. Ich hoff, ich hab Deinen Tip richtig umgesetzt (und das u auch an die richtige Stelle gesetzt) und mein Ergebnis ist kein Zufall.

Danke!

Gustav Gans

PS: Was Unicode character properties ist, was mir das sagen soll bzw. wo ich das zu meinem Vorteil einsetzten kann, verstehe ich nicht so ganz.