molily: Umlaute in URL

Beitrag lesen

Hallo,

So wie mich bei Strings ja auch die Byte-für-Byte-Darstellung interessiert, und erst in zweiter Linie die Zeichen, die durch diese Codes dargestellt werden.

Sorry, aber das glaube ich dir nicht.

Wann hast du dich das letzte Mal dafür interessiert, wie z.B. JavaScript-Engines deine Strings als Bytes speichern?

Wahrscheinlich noch nie. Selbst wenn, es würde dir nicht gelingen, es herauszufinden, denn es ist für Entwickler transparent.

In ES5 gibt es das bekannte Inkonsistenzen bei der Darstellung von Zeichen außerhalb des Basic Multilingual Plane, aber das hat mit der internen Repräsentation nichts notwendig zu tun.

In ES6 werden weitere Techniken spezifiziert, um String-Kodierung noch transparenter zu machen. Ein String ist dann eine Liste von Unicode-Zeichen. Ein solcher String hat keine inhärente Byte-Darstellung. Erst beim Speichern oder Übertragen sind Kodierungen interessant. Gut. Aber wann hast du dich das letzte Mal »in erster Linie« für die UTF-8-Sequenzen interessiert? Schreibst du Text und Code etwa im Hexeditor?

Mathias