Der Martin: utf8 - unicode

Beitrag lesen

Hallo,

Für mich ist UTF-8 ein Zeichensatz, und so wird es auch benannt.
UTF-8 ist kein Zeichensatz, sondern eine Zeichenkodierung.

stimmt, und es hat mich auch lange Zeit gekostet, das zu begreifen. Gut finden muss ich es nicht.
Zwischen Zeichensatz und Zeichencodierung zu trennen und zu unterscheiden, macht dieses ohnehin schon verzwickte Thema meiner Ansicht nach noch komplizierter.

Früher[tm] verstand man unter "Zeichensatz" die gesamte Abbildung vom numerischen Code eines Zeichens bis zum Bitmuster, das dazu auf dem Bildschirm erschien. Da war das Thema noch intuitiv.
Mit dem Siegeszug von graphischen Oberflächen koppelte man die Schriftart (Font) als rein graphische Komponente davon ab.
Später betrachtete man auch noch die interne technische Repräsentation (Bytefolge) eines bestimmten Zeichens (Zeichencodierung) als eigenes Thema.

Welche Abstraktionsstufe kommt als nächste? Phoneme?

So long,
 Martin

--
Männer haben nur eine Angst: Die Angst, kein Mann zu sein.
  (Liv Tyler, US-Schauspielerin)