Gunnar Bittersmann: regexp: unicode als zeichenklasse

Beitrag lesen

@@seth:

nuqneH

/u0130 ist ein besonderes I.

Türken und Sprecher von anderen Turksprachen mit lateinischer Schrift werden in İ nichts Besonderes sehen.

Überhaubt sollte man von dem Begriff „Sonderzeichen“ für Nicht-ASCII-Zeichen mal wegkommen, wir leben nicht mehr im Jahre 1970. In HTML gibt es genau 5 Sonderzeichen: < > & ' ". Alle anderen Zeichen (und damit sind nicht nur lateinische Buchstaben gemeint) sind nicht besonderer als A.* Es gibt allenfalls unfähige Software, die mit Unicode nicht klarkommt.

Qapla'

* Ich weiß, dass es den Komparativ nicht gibt.

--
Alle Menschen sind klug. Die einen vorher, die anderen nachher. (John Steinbeck)