seth: regexp: unicode als zeichenklasse

Beitrag lesen

gudn tach!

es ist ein besonderes "i", so wie ein "ß" ein besonderes "s"

'I'/'ı' und 'İ'/'i' sind verschieden Buchstaben des türkischen Alphabets, 'ß' ist kein 's'.

doch, aber von mir aus kein besonderes, sondern ein besonders scharfes... ;-p

es ist allerdings besonders besonders, da es offenbar das einzige utf8-zeichen ist, das als eine version eines zeichens aus [a-z] angesehen wird.

Die Besonderheit mag daher rühren, dass 'I' in Nicht-Turksprachen der Großbuchstabe von 'i' ist, in Turksprachen aber von 'ı'. Und daher, dass 'i' in Nicht-Turksprachen der Kleinbuchstabe von 'I' ist, in Turksprachen aber von 'İ'.

eben.

ein sonderzeichen ist fuer mich auch z.b. ein "!", das im ascii vorkommt.

'!' ist ein Satzzeichen (Interpunktionszeichen), daran ist nichts besonderes. Oder schreibst du ohne Punkt und Komma?

brockhaus:
Sonderzeichen,  Computertechnik, Informatik:  alle Zeichen, die nicht Buchstaben oder Ziffern sind, z. B. +, §.

duden duw:
Son|der|zei|chen, das (Druckw., EDV): Zeichen, das weder Buchstabe noch Ziffer ist.

in der wikipedia kann jeder, der moechte, selbst nachschlagen.

(Großbichstaben scheinen für dich Sonderzeichen zu sein? ;-))

nee, aber umlaute und das eszett, weil ich dafuer immer mein keyboard-layout umstellen, ascii-codes eingeben oder verrenkungen machen muss.

prost
seth