Rolf B: charset=“wtf-8”

Beitrag lesen

Hallo Gunnar,

Weder ü noch ě noch ę noch ń sind Sonderzeichen.

Für Dich vielleicht nicht. Für einen Altwessi wie mich sind das Ogonek-E und das Acut-N Glyphen, die ich noch nie gesehen habe. Immerhin hat mir die Unicode-DB verraten, wie dieses Schwänzchen am e heißt. Ich habe aber nicht die Absicht, mich zu einem Experten für Schriftzeichen aus aller Welt fortzubilden.

Aber Unicode p{L} kennt sie immerhin. Das ist aber nicht als Filter geeignet, ein Name kann schließlich auch Leerzeichen und manchmal auch Interpunktion enthalten (Ein Herr Gustav hinter dem Berge möchte seinen Familiennamen vielleicht als "h.d.Berge" eintragen). Ob Zahlen Teil eines Namens sein können, ist mir nicht ganz einsichtig. Trägt sich der aktuelle britische Thronwärmer als "Windsor, Charles Philip Arthur George" ein oder gehört das III tatsächlich zum Namen? Oder nur zum Königsnamen King Charles III.?

Aber wo ziehe ich die Grenze? Bei lateinischen oder lateinähnlichen Buchstaben mit Akzenten beliebiger Art geht's ja noch. Aber lasse ich die chinesischen Schriftzeichen zu? Wenn ja, hat das Folgen, ich muss sie ja dann auch vernünftig weiterverarbeiten können? Das ist für einen Webseitenanbieter durchaus eine Herausforderung. Wenn ich als deutscher Anbieter kein Know How in fernöstlichen Schriftarten habe, könnte die Begeisterung der fernöstlichen Besucher aus Lachkrämpfen bestehen.

Gleiches gilt für rtl-Schriften. Die Expertise zum korrekten Umgang damit haben nicht viele Menschen, die normalerweise nur mit lateinischen oder lateinähnlichen Schriften zu tun haben.

Was man eben auch daran merkt, dass ę (Was ist ein Ogonek?! Wie "nasaliere" ich ein e?!?!?) oder ń (ein n mit Acut?!?! Das kann ich gar nicht eingeben!) abgewiesen werden. Ich bin halt ein alter Wessi und Sorbisch, Litauisch oder Polnisch sind mir fremd. Bei jedem Unicode-Glyphen, den ich bereit bin, anzunehmen, muss ich mir sicher sein, ihn auch End-to-End verarbeiten zu können. Das ist eine ziemliche Herausforderung. Wenn ich Druckstücke erzeuge und meine Fonts bestimmte Glyphen nicht enthalten, stehe ich blöd da.

Und das sind Dinge, die wir in Selfhtml kaum vermitteln können. Weil wir's selbst nicht wissen - Dich vielleicht ausgenommen. Aber Du schreibst ja nicht im Wiki…

Rolf

--
sumpsi - posui - obstruxi