Der Martin: Sonderzeichen • fehlerhaft

Beitrag lesen

Hallo Gunnar,

IMHO wird es erst dann kompliziert, wenn man Zeichesatz und Zeichencodierung nicht sauber voneinander trennt.

sehe ich nicht so - ich habe kein Problem, die beiden Dinge zu verschmelzen. Aber wenn es die Situation unbedingt erfordert -und nur dann- bin ich auch bereit und in der Lage, das zu unterscheiden.

Trotzdem halte ich es für legitim und in gewissem Maß sinnvoll, auch UTF-8 als Zeichensatz zu bezeichnen
Ich nicht. Schon der Name macht das deutlich: UTF-8 (Abk. für 8-bit Unicode Transformation Format) [Wikipedia]

Der Name macht aber ebenso deutlich, dass die Codierung untrennbar mit dem Unicode-Zeichensatz verbunden ist.

Ebensowenig verstehe ich, warum Gunnar Bittersmann als "Keeper of Charsets and Encodings" vehement darauf besteht, dass auch z.B. ISO-8859-x oder Windows-nnnn "nur" Zeichencodierungen seien.
Es sind Zeichencodierungen, Punkt. Zur Unterscheidung von diesen sollte man den entsprechenden Zeichensatz "Latin 1" nennen.

Das meine ich: Warum hast du so ein Problem, die verschiedenen Codierungen als vollkommen getrennte Systeme, eben als eigenständige Zeichensätze mit einer 1:1-Zuordnung vom Code zum Symbol zu sehen? Du krallst dich IMHO viel zu sehr an den offiziellen Bezeichnungen fest. Die mögen korrekt sein, dagegen sag' ich ja gar nichts, aber alles andere als anschaulich. Jemand, der sich mit dem Thema nicht schon jahrelang beschäftigt, tut sich viel leichter, wenn man ihm das System Code=Symbol als Zeichensatz verkauft, anstatt zwischen Codierung und Zeichensatz nochmal zu unterscheiden.

Ach, waren das noch herrlich einfache Zeiten, als der Begriff "Zeichensatz" nicht nur die Zuordnung von Codes zu Symbolen, sondern sogar noch das Aussehen jedes Symbols, also die zugehörigen Bitmap-Definitionen umfasste. Wenn in den 80er Jahren einer von meinen C64-Kumpanen erzählte, er habe "einen Zeichensatz entworfen", dann hieß dass, er hatte einen Satz von bis zu 256 Symbolen als Bitmaps angefertigt. Dass diese Symbole den Codes 0x00..0xFF zugeordnet waren, war selbstverständlich und bedurfte keiner Erwähnung.
Solche einfachen Denkmodelle wären auch mit den heutigen Systemen noch vorstellbar, aber es wird von den Theoretikern meist unnötig verkompliziert.

Wenn du schon Zweifel an molilys und meinen Ausführungen hegst, warum liest du dann nicht erstmal nach? [HTML401 §5.3.1, XML §4.1]

Weil ich nie weiß, wo genau ich im Wust von Dutzenden von Spezifikationen nach solchen Hinweisen suchen soll.

Eigentlich kann der Begriff »Zeichensatz« sterben,
Wenn es sowieso immer UCS ist, braucht man ihn wirklich nicht mehr.

Oder Latin-1, wie du weiter oben selbst eingeräumt hast.

Warum verweigerst du dich, dazu „Zeichencodierung“ zu sagen?

Ich weigere mich nicht. Ich suche nur nach anschaulichen Darstellungen, um die korrekten, aber komplizierten auch einem Laien verständlich zu machen.

genauso, wie im Laien- und Verkäuferjargon das PC-Gehäuse mit all seinen Einbauteilen als "CPU" bezeichnet wird.
Ist das so? Hab ich noch nicht gehört. Andere Ländle, andere Sprache ...

Schau dir mal Kataloge von Büromöbel-Anbietern an. Da gibt's oft spezielle Computerschreibtische, auch platzsparende Modelle für zuhause, die meistens ein separates Fach oder eine Ablage "für die CPU" haben. Das ist kein regionaler Ausdruck!

Ich bin nicht sicher, ob ich bei einem solchen Verkäufer etwas kaufen würde.

Mir wäre egal, was der mir erzählt - wenn er mir das verkauft, was ich haben möchte, und zu einem Preis, den ich akzeptieren kann. Dass Verkäufer wirklich Ahnung von dem haben, was sie verkaufen, ist leider eine rühmliche Ausnahme.

Schönen Abend noch,
 Martin

--
Der Mensch denkt, Gott lenkt.
Der Mensch dachte, Gott lachte.