Matthias Scharwies: charset=“wtf-8”

Servus!

https://wtf-8.stępień.com/

Bitte denkt dran bei der clientseitigen Formularvalidierung.

Herzliche Grüße

Matthias Scharwies

--
Was ist eine Signatur?
  1. Moin Matthias,

    https://wtf-8.stępień.com/

    Bitte denkt dran bei der clientseitigen Formularvalidierung.

    funktioniert das dann nur oder auch mit charset=„wtf-8“? 😉

    Das Problem ist klar, aber ein paar Worte zu möglichen Lösungen wären vermutlich zielführend.

    Viele Grüße
    Robert

    1. Servus!

      Moin Matthias,

      https://wtf-8.stępień.com/

      Bitte denkt dran bei der clientseitigen Formularvalidierung.

      funktioniert das dann nur oder auch mit charset=„wtf-8“? 😉

      Das Problem ist klar, aber ein paar Worte zu möglichen Lösungen wären vermutlich zielführend.

      Okey, @Gunnar Bittersmann hatte es schon des Öfteren erwähnt:

      Gehe bei Formulareingaben nicht von deinen Erwartungen aus:

      {{Beachte|Versuche nicht eine Namenseingabe mit einem [[HTML/Attribute/pattern|pattern]] auf Buchstabenfolgen einzugrenzen.

      • Joseph Biden jun. enthält ein Satzzeichen.
      • Robert III eine - wenn auch - römische Zahl
      • Ausländische Namen wie z.B. „Stępień“ haben Diakritische_Zeichen, die als Sonderzeichen einen solche Eingabe zurückweisen würden, obwohl der Name so geschrieben wird.<ref>[https://wtf-8.stępień.com/ wtf-8.stępień.com]</ref> }}

      Wo im Tutorial sollte diese Warnung platziert werden?

      Herzliche Grüße

      Matthias Scharwies

      --
      Was ist eine Signatur?
      1. Hallo Matthias,

        insbesondere sollte die Antwort auf die Frage, welche Zeichen man für eine Plausibilitätsprüfung des Namens zulassen sollte, lauten: „Alle“. Man kann höchstens für Eingaben, die eine bestimmte Merkwürdigkeitsschwelle überschreiten, ein Vorsicht-Flag setzen und manuell kontrollieren. Eine Plausi-Logik, die mit allen Kulturen dieser Welt klarkommt, möchte ich nicht programmieren müssen.

        Zugegeben, das erlaubt dann Spaßvögeln einen Namen wie 💩 oder q ɟןoᴚ. Die Frage ist aber, welcher Schaden größer ist.

        Auf die Frage "was ist mit ' oder <, die zerreißen mir doch das HTML oder die DB-Zugriffe" antwortet man mit: Ja und?

        Natürlich ist die Plausi ".*" für Namen eine Herausforderung, wenn es um die Darstellung dieser Namen auf LED oder Papier geht. Die heutigen Fonts decken aber einen sehr breiten Unicode-Bereich ab. Wenn mir jemand seinen Namen unbedingt in Linear-A eingeben will, dann fällt es halt schwer mit dem Adressetikettendruck (es sei denn, ich versende Tontäfelchen...)

        Rolf

        --
        sumpsi - posui - obstruxi
      2. @@Matthias Scharwies

        • Ausländische Namen wie z.B. „Stępień“ haben Diakritische_Zeichen, die als Sonderzeichen einen solche Eingabe zurückweisen würden, obwohl der Name so geschrieben wird.<ref>[https://wtf-8.stępień.com/ wtf-8.stępień.com]</ref>

        Inländische Namen wie z.B. Müller haben auch diakritische Zeichen (die vermutlich nicht zurückgewiesen werden).

        Inländische Namen wie z.B. Brězan haben auch diakritische Zeichen (die zurückgewiesen werden).

        Ist der Name Stępień „ausländisch“, wenn die Person einen deutschen Pass hat?

        Weder ü noch ě noch ę noch ń sind Sonderzeichen.

        Kwakoni Yiquan

        --
        Ad astra per aspera
        1. Hallo Gunnar,

          Weder ü noch ě noch ę noch ń sind Sonderzeichen.

          Für Dich vielleicht nicht. Für einen Altwessi wie mich sind das Ogonek-E und das Acut-N Glyphen, die ich noch nie gesehen habe. Immerhin hat mir die Unicode-DB verraten, wie dieses Schwänzchen am e heißt. Ich habe aber nicht die Absicht, mich zu einem Experten für Schriftzeichen aus aller Welt fortzubilden.

          Aber Unicode p{L} kennt sie immerhin. Das ist aber nicht als Filter geeignet, ein Name kann schließlich auch Leerzeichen und manchmal auch Interpunktion enthalten (Ein Herr Gustav hinter dem Berge möchte seinen Familiennamen vielleicht als "h.d.Berge" eintragen). Ob Zahlen Teil eines Namens sein können, ist mir nicht ganz einsichtig. Trägt sich der aktuelle britische Thronwärmer als "Windsor, Charles Philip Arthur George" ein oder gehört das III tatsächlich zum Namen? Oder nur zum Königsnamen King Charles III.?

          Aber wo ziehe ich die Grenze? Bei lateinischen oder lateinähnlichen Buchstaben mit Akzenten beliebiger Art geht's ja noch. Aber lasse ich die chinesischen Schriftzeichen zu? Wenn ja, hat das Folgen, ich muss sie ja dann auch vernünftig weiterverarbeiten können? Das ist für einen Webseitenanbieter durchaus eine Herausforderung. Wenn ich als deutscher Anbieter kein Know How in fernöstlichen Schriftarten habe, könnte die Begeisterung der fernöstlichen Besucher aus Lachkrämpfen bestehen.

          Gleiches gilt für rtl-Schriften. Die Expertise zum korrekten Umgang damit haben nicht viele Menschen, die normalerweise nur mit lateinischen oder lateinähnlichen Schriften zu tun haben.

          Was man eben auch daran merkt, dass ę (Was ist ein Ogonek?! Wie "nasaliere" ich ein e?!?!?) oder ń (ein n mit Acut?!?! Das kann ich gar nicht eingeben!) abgewiesen werden. Ich bin halt ein alter Wessi und Sorbisch, Litauisch oder Polnisch sind mir fremd. Bei jedem Unicode-Glyphen, den ich bereit bin, anzunehmen, muss ich mir sicher sein, ihn auch End-to-End verarbeiten zu können. Das ist eine ziemliche Herausforderung. Wenn ich Druckstücke erzeuge und meine Fonts bestimmte Glyphen nicht enthalten, stehe ich blöd da.

          Und das sind Dinge, die wir in Selfhtml kaum vermitteln können. Weil wir's selbst nicht wissen - Dich vielleicht ausgenommen. Aber Du schreibst ja nicht im Wiki…

          Rolf

          --
          sumpsi - posui - obstruxi
          1. @@Rolf B

            Weder ü noch ě noch ę noch ń sind Sonderzeichen.

            Für Dich vielleicht nicht. Für einen Altwessi wie mich sind das Ogonek-E und das Acut-N Glyphen, die ich noch nie gesehen habe.

            Fremd ≠ besonders.

            Sonderzeichen sind für mich Zeichen, die in einem bestimmten Kontext eine Sonderbedeutung haben. Im HTML-Kontext sind bspw. <, ", ' und & Sonderzeichen – und müssen ggfs. als solche behandelt werden.

            Für Buchstaben trifft das i.A. nicht zu.

            (Im URL-Kontext schon; da müssen Nicht-ASCII-Zeichen behandelt werden: im Domainnamen als Punycode, im Pfad prozentcodiert. Falls man diese Behandlung selbst machen will/muss und nicht dem Browser überlassen kann.)

            Aber wo ziehe ich die Grenze? Bei lateinischen oder lateinähnlichen Buchstaben mit Akzenten beliebiger Art geht's ja noch. Aber lasse ich die chinesischen Schriftzeichen zu?

            Je nach Anwendungsfall. Bei einer Anmeldung für ein Forum oder Chat würd ich keine Beschränkung machen.

            Bei einer Anmeldung für eine internationale Konferenz würde ich den Namen (der dann auch so aufs Namensschild gedruckt wird) in lateinischer Umschrift verlangen, damit ihn alle lesen können. Was nicht heißt, ihn auch richtig aussprechen zu können.

            Zusätzlich könnte man ein optionales Feld für den Namen in nativer Schrift anbieten. Dann kann Kim Seulgi neben der Romanisierung auch „김슬기“ auf ihrem Schildchen zu stehen haben. (Wobei Kim der Familienname ist.)

            ę (Was ist ein Ogonek?! Wie "nasaliere" ich ein e?!?!?)

            Wie es Französischsprecher bei main tun.

            Polnischsprecher nasalieren übrigens kaum noch. Je nach nachfolgendem Konsonanten wird ę als /ɛm/, /ɛn/, /ɛɲ/ oder /ɛŋ/, am Wortende /ɛ/ geprochen. Proszę. /ˈprɔʂɛ/

            oder ń (ein n mit Acut?!?!

            Im Spanischen ist’s ñ, im Portugiesischen nh, im Französischen und Italienischen gn.

            Das kann ich gar nicht eingeben!

            Ich schon:

            Tastaturlayout-Auswahlmenü (macOS)

            Man hat halt die Tastaturtreiber installiert, die man so braucht.

            (Den Treiber für deutsche Tastatur (QWERTZ) brauch ich übrigens nie. Den hab ich nur drauf, falls ihn mal jemand anderes auf meinem Comuter braucht.)

            Bei jedem Unicode-Glyphen, den ich bereit bin, anzunehmen

            Bei Unicode geht’s um Zeichen, nicht um Glyphen.

            muss ich mir sicher sein, ihn auch End-to-End verarbeiten zu können. Das ist eine ziemliche Herausforderung. Wenn ich Druckstücke erzeuge und meine Fonts bestimmte Glyphen nicht enthalten, stehe ich blöd da.

            Ja, Augen auf bei der Schriftauswahl. Wenn abzusehen ist, dass man auch Zeichen aus anderen Sprachen darzustellen hat, sollte man eine Schrift wählen, die auch Glyphen für diese Zeichen bereitstellt. Sonst sieht’s blöd aus; ohne diese Zeichen ganz blöd, aber auch mit Zeichen aus anderer Schriftart blöd. (Beispiel)

            Vor einiger Zeit hab ich mal dafür gesorgt, dass das im Tagesspiegel nicht mehr so ist:

            Tweet vom 18. Oktober 2022: „BTW: Ich hab da schon ein Bugticket aufgemacht, dass č, ň, ť usw. aus einer falschen Schrift gesetzt sind.“ Tweet vom 3. Januar 2023: „Ist jetzt behoben. Auch č, ň und ť sehen jetzt so aus wie sich @VikBurian  das dachte.“

            Und so hab ich’s gemacht.

            Kwakoni Yiquan

            --
            Ad astra per aspera
        2. Lieber Gunnar,

          Ist der Name Stępień „ausländisch“, wenn die Person einen deutschen Pass hat?

          beim Namen könnte man argumentieren, dass er nicht dem für diese Landschaften üblichen Kulturkreis entsprungen ist. Er bezeichnet wohl unter anderem einen Ort in der Woiwodschaft Ermland-Masuren in Polen, ehemals Stangendorf. Qualifiziert ihn das aus deutscher Perspektive als „ausländisch“? Ich habe absolut keine Ahnung, welche kulturellen Gemeinsamkeiten es mit unseren Bundesländern gibt. Das wäre für mich ausschlaggebend, diese Frage zu beantworten, keinesfalls die Erteilung eines deutschen Passes an eine Person dieses Namens.

          Die Person selbst darf ganz für sich selbst entscheiden, ob sie als „ausländisch“ gelesen werden will. Ein Pass hat etwas mit Rechten und Pflichten zu tun, nicht wirklich mit gelebter Kultur. Letztere darf sich jeder Mensch ganz nach seinen Überzeugungen zu eigen machen.

          Weder ü noch ě noch ę noch ń sind Sonderzeichen.

          Kommt das nicht auf die Perspektive an? ASCII zum Bleistift? Am Besten gleich 6-bit ASCII, das kennt dann überhaupt keine Buchstaben mehr. So alleine klingt der Satz für mich zusammenhangslos.

          Liebe Grüße

          Felix Riesterer

  2. @@Matthias Scharwies

    https://wtf-8.stępień.com/

    Bitte denkt dran bei der clientseitigen Formularvalidierung.

    Ich wette, Namen werden akzeptiert, wenn sie Buchstaben enthalten, die in westeuropäischen Sprachen wie Spanisch und Französisch verwendet werden. Mitteleuropäische Sprachen werden ignoriert. 😫

    Kwakoni Yiquan

    --
    Ad astra per aspera
    1. Servus!

      @@Matthias Scharwies

      https://wtf-8.stępień.com/

      Bitte denkt dran bei der clientseitigen Formularvalidierung.

      Ich wette, Namen werden akzeptiert, wenn sie Buchstaben enthalten, die in westeuropäischen Sprachen wie Spanisch und Französisch verwendet werden. Mitteleuropäische Sprachen werden ignoriert. 😫

      Bei ñ und ç wäre ich mir da gar nicht so sicher.

      Aber tendenziell hast du bestimmt Recht.

      Herzliche Grüße

      Matthias Scharwies

      --
      Was ist eine Signatur?
      1. Hi,

        Ich wette, Namen werden akzeptiert, wenn sie Buchstaben enthalten, die in westeuropäischen Sprachen wie Spanisch und Französisch verwendet werden. Mitteleuropäische Sprachen werden ignoriert. 😫

        Bei ñ und ç wäre ich mir da gar nicht so sicher.

        Beide sind in ISO-8859-1(5) drin. Das spricht für deren Akzeptanz (falls kein UTF-8 verwendet wird)

        cu,
        Andreas a/k/a MudGuard

        1. Servus!

          Hi,

          Ich wette, Namen werden akzeptiert, wenn sie Buchstaben enthalten, die in westeuropäischen Sprachen wie Spanisch und Französisch verwendet werden. Mitteleuropäische Sprachen werden ignoriert. 😫

          Bei ñ und ç wäre ich mir da gar nicht so sicher.

          Beide sind in ISO-8859-1(5) drin. Das spricht für deren Akzeptanz (falls kein UTF-8 verwendet wird)

          Es geht ja drum, dass Webdeveloper bestimmte Zeichen (A-Z,a-z ä,é, è, ü,ö,ß) zur Eingabe vorgeben und andere ablehnen, was dann bei ... Namen zur erfolglosen Eingabe führt.

          Herzliche Grüße

          Matthias Scharwies

          --
          Was ist eine Signatur?
  3. Hi,

    Bitte denkt dran bei der clientseitigen Formularvalidierung.

    nun ja, clientseitig mag man das noch gut adressieren können. Spätestens dann, wenn der Datensatz durch eine dieser Alibi Supadupa Compliance WebApplication Firewalls muss, gibt es dann Probleme mit false positive Blockierung.

    Denn diese Firewalls blockieren nach oft zweifelhaften Heuristiken. Und dann geht der Spass los, dass man sich rechtfertigen muss, warum eine Firewall-Regel deaktiviert werden muss oder nicht auf bestimmte Parameter angewendet werden soll. Auf so etwas hat man dann oft keine Lust, Zeit und im Ergebnis begrenzt die Eingabefelder für Namen auf die "klassischen" Character. Alles schon erlebt. Ähnliches gibt es dann auch bei serverless Datenbanken.

    Bei JavaScript kann man Personennamen relative einfach über die Unicode character classes mit Regexp validieren: /^[\p{L} -]*$/gu

    1. Hi,

      Bei JavaScript kann man Personennamen relative einfach über die Unicode character classes mit Regexp validieren: /^[\p{L} -]*$/gu

      ist das so einfach? Ja, wenn man Namen wie "" oder "- - -" oder " " oder " " zulassen will … Oder "QQQ". Oder …

      cu,
      Andreas a/k/a MudGuard

      1. Hi,

        Nachtrag, Editierzeit ist schon vorbei.

        Bei JavaScript kann man Personennamen relative einfach über die Unicode character classes mit Regexp validieren: /^[\p{L} -]*$/gu

        ist das so einfach? Ja, wenn man Namen wie "" oder "- - -" oder " " oder " " zulassen will … Oder "QQQ". Oder …

        Oder wenn man Iren ausschließen will (O'Sullivan, O'Flaherty) Oder …

        cu,
        Andreas a/k/a MudGuard

        1. @@MudGuard

          Oder wenn man Iren ausschließen will (O'Sullivan, O'Flaherty)

          Sollen sie sich halt vernünfig schreiben: Ó Súilleabháin, Ó Flaithbheartaigh, nicht eingeenglischt. SCNR.

          Kwakoni Yiquan

          --
          Ad astra per aspera
          1. Hi,

            Sollen sie sich halt vernünfig schreiben: Ó Súilleabháin, Ó Flaithbheartaigh, nicht eingeenglischt. SCNR.

            Müßte doch dann aber eher ein Fada statt des Acutes sein …

            cu,
            Andreas a/k/a MudGuard

            1. Hallo MudGuard,

              wenn Du vielleicht kurz den Codepoint für O oder u mit Fada statt Acut heraussuchen könntest? Meine Suchmaschine leidet da an akuter Blindheit und liefert mir nur U+1FADA (leider unbelegt)…

              Rolf

              --
              sumpsi - posui - obstruxi
            2. @@MudGuard

              Sollen sie sich halt vernünfig schreiben: Ó Súilleabháin, Ó Flaithbheartaigh, nicht eingeenglischt. SCNR.

              Müßte doch dann aber eher ein Fada statt des Acutes sein …

              Sollte sich das typographisch unterscheiden?

              Es gibt Stimmen, die sagen, dass der Strich bei ć, ń, ó, ś und ź im Polnischen steiler sein sollte als ein Akut. [Twardoch] Andere Stimmen sagen, das wäre nur eine Legende aus einer Zeit, wo Schriftarten Mode waren, die steilere Akuts hatten als heute gängige – auch in Sprachen wie Französisch und Spanisch.

              Möglich wäre solch eine Unterscheidung durch das OpenType-Feature locl (so wie es spezielle Glyphen für Serbisch und Bulgarisch gibt, sofern der Font das unterstützt). Ich hab allerdings noch keinen Font gefunden, der das für Polnisch anbietet.

              Kwakoni Yiquan

              --
              Ad astra per aspera
              1. Hi,

                Sollte sich das typographisch unterscheiden?

                Ist das ein Argument?

                Du beschwerst Dich doch immer, wenn jemand ein ASCII-Minus (also einen horizontalen Strich) benutzt anstelle eines Gedankenstrichs (also eines horizontalen Strichs) benutzt …

                Abgesehen davon, ich hab das Fada des öfteren als senkrechten Strich, nicht als nach rechts geneigten Strich, gesehen.

                Aber das waren von Iren geschriebene Texte - von denen kann man natürlich nicht erwarten, daß die wissen, wie ein Fada aussehen muß …

                cu,
                Andreas a/k/a MudGuard

      2. Hi,

        1. Es ging mir darum, dass man mit Unicode Character Classes einfach alle Letter erfassen kann, wenn man es benötigt. Man kann das Ganze auch noch um Punctions \p{P} erweitern, oder um Zahlen etc.

        2. Ich würde mir clientseitig aber keine Mühe geben bzw. gar keine Validierung vorschrieben. Entscheidend ist, was am Backend erlaubt ist oder abgewiesen wird.

        Gruss Michael

  4. @@Matthias Scharwies

    https://wtf-8.stępień.com/

    Bitte denkt dran bei der clientseitigen Formularvalidierung.

    Im gestrigen Newsletter vom Smashing Magazine (den kriegt ihr auch, oder?): ein Link zu 40 Annahmen über Namen, die allesamt falsch sind.

    Ich mag 27/28. 😊

    Kwakoni Yiquan

    --
    Ad astra per aspera
    1. Hallo Gunnar Bittersmann,

      I can safely assume that this dictionary of bad words contains no people’s names in it.

      Indeed. Wir hätten da bei uns mal einen Abteilungsleiter gehabt, der darüber gestolpert wäre. Abgesehen sind Schimpfworte international heimtückisch, ich denke da an diesen Lapsus mit dem Mitsubishi Pajero Montero…

      People have names

      Ups. Ohne einen Namen sind sie aber schwierig in einer Akte zu erfassen. Auch wenn vorher schon darauf hingewiesen wurde, dass die Namensvergabe nicht notwendigerweise bei der Geburt erfolgt, dann frage ich mich aber doch, wie man einen Menschen in einem System eintragen soll, wenn er sich seinen Namen erst durch ein Heiliges Initiationsritual erwerben muss. Als Nummer? Als "Dritter Sohn von Flinker Fuß (vermutlich) und Feine Fischerin, geboren (glaube ich) im Dritten Jahr, als Fröhlicher Fuchs unser Häuptling war"? Heijeijei… schwierig. Auch ohne Computer.

      Rolf

      --
      sumpsi - posui - obstruxi
      1. Hi,

        Ups. Ohne einen Namen sind sie aber schwierig in einer Akte zu erfassen.

        Ich hab schon einen deutschen Personalausweis gesehen, bei dem nur der Nachname gefüllt war.

        Der Kunde hat bei uns im Vornamensfeld - eingetragen. Ging so auch in unsere DB. Unser Geschäftspartner hat den Datensatz mit dem - nicht akzeptiert, dadurch haben wir das überhaupt erst bemerkt.

        Wir haben dann beim Kunden nachgefragt, und der meinte dann, er hätte keinen Vornamen. Haben wir nicht geglaubt, und uns den Personalausweis (als Photo) zuschicken lassen.

        Und siehe da, er hatte dort tatsächlich keinen Vornamen eingetragen.

        Schön ist auch die Annahme (eines Geschäftspartners), mehr als 4 Konsonanten nacheinander kann's doch nicht geben. Falsch, es gibt ein kyrillisches Zeichen, das beim Transkribieren nach lateinischer Schrift schon mal zu schtsch wird … (wobei auch schon eine Person namens Arschloch auf mehr als 4 käme)

        cu,
        Andreas a/k/a MudGuard

        1. @@MudGuard

          Schön ist auch die Annahme (eines Geschäftspartners), mehr als 4 Konsonanten nacheinander kann's doch nicht geben. […] (wobei auch schon eine Person namens Arschloch auf mehr als 4 käme)

          Und eine Person namens Angstschweiß erst!

          Wenngleich die Zählweise Mumpitz ist. Bzw. die Benennung von Buchstaben als „Konsonanten“.

          Konsonanten sind Laute, keine Buchstaben.

          Beim Arschloch /​ˈ​aʁʃlɔx/ sind da nur drei Konsonanten in Folge; bei der Aussprache /​ˈ​aːɐ̯ʃlɔx/ gar nur zwei. Beim Angstschweiß /ˈ​aŋstʃvaɪ̯s/ sind’s immerhin fünf.

          Kwakoni Yiquan

          --
          Ad astra per aspera
          1. Lieber Gunnar,

            Beim Arschloch /​ˈ​aʁʃlɔx/ sind da nur drei Konsonanten in Folge; bei der Aussprache /​ˈ​aːɐ̯ʃlɔx/ gar nur zwei. Beim Angstschweiß /ˈ​aŋstʃvaɪ̯s/ sind’s immerhin fünf.

            und bei Herzschmerz?

            Liebe Grüße

            Felix Riesterer

            1. @@Felix Riesterer

              Lieber Gunnar,

              Beim Arschloch /​ˈ​aʁʃlɔx/ sind da nur drei Konsonanten in Folge; bei der Aussprache /​ˈ​aːɐ̯ʃlɔx/ gar nur zwei. Beim Angstschweiß /ˈ​aŋstʃvaɪ̯s/ sind’s immerhin fünf.

              und bei Herzschmerz?

              Vier, würd ich sagen: /ˈ​hɛʁt͡sʃmɛʁt͡s/. (/t͡s/ zähle ich als einen Laut.)

              Kwakoni Yiquan

              --
              Ad astra per aspera
      2. Hallo

        Ups. Ohne einen Namen sind sie aber schwierig in einer Akte zu erfassen. Auch wenn vorher schon darauf hingewiesen wurde, dass die Namensvergabe nicht notwendigerweise bei der Geburt erfolgt, dann frage ich mich aber doch, wie man einen Menschen in einem System eintragen soll, wenn er sich seinen Namen erst durch ein Heiliges Initiationsritual erwerben muss. Als Nummer?

        Ahem: Das Kind ohne Namen a.k.a. „L 57 83 09“

        Tschö, Auge

        --
        „Habe ich mir das nur eingebildet, oder kann der kleine Hund wirklich sprechen?“ fragte Schnapper. „Er behauptet, nicht dazu imstande zu sein“ erwiderte Victor. Schnapper zögerte (…) „Nun …“ sagte er schließlich, „ich schätze, er muss es am besten wissen.“ Terry Prattchett, Voll im Bilde
    2. Hi,

      naja, ich habe nur bis zu dieser Stelle ernsthaft gelesen:

      name is — by definition — an appropriate identifier for them ... because names are central to our identities, virtually by definition.

      Wer heutzutage als Entwickler Personennamen als Identifier benutzt/konstruiert, der hat ganz andere Probleme. Warum nicht gleich die Schuhgröße als Identifier benutzten?

      Gruss Michael

    3. Servus!

      @@Matthias Scharwies

      https://wtf-8.stępień.com/

      Bitte denkt dran bei der clientseitigen Formularvalidierung.

      Im gestrigen Newsletter vom Smashing Magazine (den kriegt ihr auch, oder?):

      bis jetzt noch nicht, hab' ihn grad abonniert!

      ein Link zu 40 Annahmen über Namen, die allesamt falsch sind.

      Ich mag 27/28. 😊

      Ich werde die Ergebniss aus diesem Thread am Wochenende ins Wiki packen. Mein Textvorschlag:

      Gehe bei Formulareingaben nicht von deinen Erwartungen aus:

      {{Beachte|Es mag verlockend scheinen, eine Plausibilitätsprüfung von Namen bereits clientseitig mit einem [[HTML/Attribute/pattern|pattern]] und einem einem RegEx (<code>/[1]+$/</code> auf Buchstabenfolgen einzugrenzen.mit ) vorzunehmen.

      • Joseph Biden jun. und Mike O'Connor enthalten Satzzeichen im Namen.
      • Robert III eine - wenn auch - römische Zahl
      • Namen wie Müller haben Umlaute, aber z.B. „Stępień“ haben weitere Diakritische_Zeichen, die bei einem RegEx zurückgewiesen würden, obwohl der Name so geschrieben wird.<ref>[https://wtf-8.stępień.com/ wtf-8.stępień.com]</ref>

      }}

      Wo im Tutorial sollte diese Warnung platziert werden?

      Herzliche Grüße

      Matthias Scharwies

      --
      Was ist eine Signatur?

      1. A-Za-z ↩︎

      1. Hi,

        {{Beachte|Es mag verlockend scheinen, eine Plausibilitätsprüfung von Namen bereits clientseitig mit einem [[HTML/Attribute/pattern|pattern]] und einem einem RegEx (<code>/[1]+$/</code> auf Buchstabenfolgen einzugrenzen.mit ) vorzunehmen.

        • Joseph Biden jun. und Mike O'Connor enthalten Satzzeichen im Namen.
        • Robert III eine - wenn auch - römische Zahl
        • Namen wie Müller haben Umlaute, aber z.B. „Stępień“ haben weitere Diakritische_Zeichen, die bei einem

        ungeeigneten

        RegEx zurückgewiesen würden, obwohl der Name so geschrieben wird.<ref>[https://wtf-8.stępień.com/ wtf-8.stępień.com]</ref>

        }}

        cu,
        Andreas a/k/a MudGuard


        1. A-Za-z ↩︎

        1. Servus!

          Hi,

          {{Beachte|Es mag verlockend scheinen, eine Plausibilitätsprüfung von Namen bereits clientseitig mit einem [[HTML/Attribute/pattern|pattern]] und einem einem RegEx (<code>/[1]+$/</code> auf Buchstabenfolgen einzugrenzen.mit ) vorzunehmen.

          • Joseph Biden jun. und Mike O'Connor enthalten Satzzeichen im Namen.
          • Robert III eine - wenn auch - römische Zahl
          • Namen wie Müller haben Umlaute, aber z.B. „Stępień“ haben weitere Diakritische_Zeichen, die bei einem ungeeigneten

          Danke!

          Herzliche Grüße

          Matthias Scharwies

          --
          Was ist eine Signatur?

          1. A-Za-z ↩︎

    4. @@Gunnar Bittersmann

      40 Annahmen über Namen, die allesamt falsch sind.

      Noch eine falsche Annahme über Namen: Sortierung wäre einfach.

      So wird Ludwig van Beethoven unter B einsortiert:

      1. Johann Sebastian Bach
      2. Ludwig van Beethoven
      3. Georges Bizet

      Steve Van Zandt hingegen unter V:

      1. Garry W. Tallent
      2. Steve Van Zandt
      3. Max Weinberg

      (drei Mitglieder der legendären E Street Band)

      Kwakoni Yiquan

      --
      Ad astra per aspera