Gunnar Bittersmann: charset=“wtf-8”

Beitrag lesen

@@Rolf B

Weder ü noch ě noch ę noch ń sind Sonderzeichen.

Für Dich vielleicht nicht. Für einen Altwessi wie mich sind das Ogonek-E und das Acut-N Glyphen, die ich noch nie gesehen habe.

Fremd ≠ besonders.

Sonderzeichen sind für mich Zeichen, die in einem bestimmten Kontext eine Sonderbedeutung haben. Im HTML-Kontext sind bspw. <, ", ' und & Sonderzeichen – und müssen ggfs. als solche behandelt werden.

Für Buchstaben trifft das i.A. nicht zu.

(Im URL-Kontext schon; da müssen Nicht-ASCII-Zeichen behandelt werden: im Domainnamen als Punycode, im Pfad prozentcodiert. Falls man diese Behandlung selbst machen will/muss und nicht dem Browser überlassen kann.)

Aber wo ziehe ich die Grenze? Bei lateinischen oder lateinähnlichen Buchstaben mit Akzenten beliebiger Art geht's ja noch. Aber lasse ich die chinesischen Schriftzeichen zu?

Je nach Anwendungsfall. Bei einer Anmeldung für ein Forum oder Chat würd ich keine Beschränkung machen.

Bei einer Anmeldung für eine internationale Konferenz würde ich den Namen (der dann auch so aufs Namensschild gedruckt wird) in lateinischer Umschrift verlangen, damit ihn alle lesen können. Was nicht heißt, ihn auch richtig aussprechen zu können.

Zusätzlich könnte man ein optionales Feld für den Namen in nativer Schrift anbieten. Dann kann Kim Seulgi neben der Romanisierung auch „김슬기“ auf ihrem Schildchen zu stehen haben. (Wobei Kim der Familienname ist.)

ę (Was ist ein Ogonek?! Wie "nasaliere" ich ein e?!?!?)

Wie es Französischsprecher bei main tun.

Polnischsprecher nasalieren übrigens kaum noch. Je nach nachfolgendem Konsonanten wird ę als /ɛm/, /ɛn/, /ɛɲ/ oder /ɛŋ/, am Wortende /ɛ/ geprochen. Proszę. /ˈprɔʂɛ/

oder ń (ein n mit Acut?!?!

Im Spanischen ist’s ñ, im Portugiesischen nh, im Französischen und Italienischen gn.

Das kann ich gar nicht eingeben!

Ich schon:

Tastaturlayout-Auswahlmenü (macOS)

Man hat halt die Tastaturtreiber installiert, die man so braucht.

(Den Treiber für deutsche Tastatur (QWERTZ) brauch ich übrigens nie. Den hab ich nur drauf, falls ihn mal jemand anderes auf meinem Comuter braucht.)

Bei jedem Unicode-Glyphen, den ich bereit bin, anzunehmen

Bei Unicode geht’s um Zeichen, nicht um Glyphen.

muss ich mir sicher sein, ihn auch End-to-End verarbeiten zu können. Das ist eine ziemliche Herausforderung. Wenn ich Druckstücke erzeuge und meine Fonts bestimmte Glyphen nicht enthalten, stehe ich blöd da.

Ja, Augen auf bei der Schriftauswahl. Wenn abzusehen ist, dass man auch Zeichen aus anderen Sprachen darzustellen hat, sollte man eine Schrift wählen, die auch Glyphen für diese Zeichen bereitstellt. Sonst sieht’s blöd aus; ohne diese Zeichen ganz blöd, aber auch mit Zeichen aus anderer Schriftart blöd. (Beispiel)

Vor einiger Zeit hab ich mal dafür gesorgt, dass das im Tagesspiegel nicht mehr so ist:

Tweet vom 18. Oktober 2022: „BTW: Ich hab da schon ein Bugticket aufgemacht, dass č, ň, ť usw. aus einer falschen Schrift gesetzt sind.“ Tweet vom 3. Januar 2023: „Ist jetzt behoben. Auch č, ň und ť sehen jetzt so aus wie sich @VikBurian  das dachte.“

Und so hab ich’s gemacht.

Kwakoni Yiquan

--
Ad astra per aspera