Alexander (HH): regexp: unicode als zeichenklasse

Beitrag lesen

Moin Moin!

es ist ein besonderes "i", so wie ein "ß" ein besonderes "s"

'I'/'ı' und 'İ'/'i' sind verschieden Buchstaben des türkischen Alphabets, 'ß' ist kein 's'.

doch, aber von mir aus kein besonderes, sondern ein besonders scharfes... ;-p

Nö, ß ist eine Ligatur aus ſ und z bzw. ſ und s, und bis vor kurzem der einzige Buchstabe im Deutschen, für den es keinen Großbuchstaben gab, aber stattdessen zwei Ersatzschreibweisen. Dinge, die Unicode kompliziert machen: Wann mutiert ein ß in der Uppercase-Funktion zu SZ, wann zu SS?

Alexander

--
Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so".