hotti: ISO-8859-x und Codepoints

hi,

in ISO-8859-1 entspricht der Wert des Bytes dem Codepoint, d.h., die Differenz ist 0. In ISO-8859-5 beträgt die Differenz 864 (dezimal), d.h., zu Zeichen, die als 8859-5 deklariert sind, erhalte ich die Codepoints, indem ich zum Wert der Bytes 864 addiere. Gibt es irgendwo eine Übersicht, wo zu den weiteren ISO-Kodierungen die Differenzen aufgelistet sind?

Hotti

--
Wenn der Kommentar nicht zum Code passt, kann auch der Code falsch sein.
  1. in ISO-8859-1 entspricht der Wert des Bytes dem Codepoint,

    Codepoint von was - Unicode? Nein.

    1. in ISO-8859-1 entspricht der Wert des Bytes dem Codepoint,

      Codepoint von was - Unicode? Nein.

      Codepoints

      1. Hallo,

        in ISO-8859-1 entspricht der Wert des Bytes dem Codepoint,
        Codepoint von was - Unicode? Nein.
        Codepoints

        Erstens: Vermeide bitte den Begriff "Codepoint" in diesem Zusammenhang. Der Begriff wird normalerweise für Unicode verwendet. Andere Zeichencodierung verwenden andere Bytes oder Bytesequenzen, um diese Codepoints in ihrem Werte- und Geltungsbereich abzubilden.

        Zweitens: Was soll die Gegenüberstellung dieser beiden Tabellen sagen? Ich versteh's immer noch nicht.

        Eine Gesetzmäßigkeit für den Zusammenhang zwischen Zeichencodes der ISO-Codierungen und den entsprechenden Codepoints im Unicode-Chart gibt es AFAIK nicht. Jede dieser ISO-Codierungen ist innerhalb gewisser Rahmenbedingungen "willkürlich" definiert oder historisch gewachsen. Bestes Beispiel dafür dürfte ISO-8859-15 sein: Da ist die Reihe der Codepoints nämlich nicht mehr fortlaufend.

        So long,
         Martin

        --
        Die Natur ist gnädig: Wer viel verspricht, dem schenkt sie zum Ausgleich ein schlechtes Gedächtnis.
        Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
        1. hi,

          Zweitens: Was soll die Gegenüberstellung dieser beiden Tabellen sagen? Ich versteh's immer noch nicht.

          Der Codepoint in der ersten Spalte entspricht dem Wert des Bytes in einer ISO-8859-1-Kodierung. Die Differenz zwischen den Codepoints der vierten und der ersten Spalte beträgt 864. Alle Codepoint-Angaben in dezimal.

          Der Wert des Bytes(erste Spalte) plus 864 ergibt den Codepoint der in der Tabelle gezeigtn kyrillischen Zeichen, die Tabelle stellt die Umrechnung zwischen ISO-8859-5 zum Codepoint der ausgewählten kyrillischen Zeichen dar.

          .. Bestes Beispiel dafür dürfte ISO-8859-15 sein: Da ist die Reihe der Codepoints nämlich nicht mehr fortlaufend.

          Freilich gibt es Ausnahmen ;)

          1. @@hotti:

            nuqneH

            Alle Codepoint-Angaben in dezimal.

            Was schonmal ziemlich unsinnig ist.

            Freilich gibt es Ausnahmen ;)

            Wohl mehr als Regeln. Schon zwischen ISO 8859-2 und Unicode wirst du keine einfache Beziehung finden.

            Was soll der Quatsch überhaupt? Das Einzige, was zu ISO 8859 noch zu sagen ist, ist, dass es eine Familie von historischen Zeichencodierungen ist, die früher einmal bedeutsam waren, heute jedoch nicht mehr verwendet werden (sollten) – außer von denen, die de Sinn von Unicode und Unicode-Codierungen immer noch nicht verstanden haben. Willst du dich selbst outen?

            Qapla'

            --
            Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
            (Mark Twain)
            1. hi,

              Was soll der Quatsch überhaupt?

              War nur eine Frage, eher nebensächlich aber nicht uninteressant, sonst hätte ich sie nicht gestellt.

    2. Das ist mir nicht erschöpfend genug. Für ein einfaches Nein verdienst du kein "fachlich hilfreich"!

      Es liegt auf der Hand, dass die Codepoints nicht beliebig oder zufällig belegt wurden, wie das Beispiel des OP belegt (864 ist 3⅜ × 2⁸). Blöcke werden meist immer als ganze Entsprechung, damit die Algorithmen zur Transkodierung möglichst unaufwändig ausfallen.

      http://www.unicode.org/Public/MAPPINGS/
      http://userguide.icu-project.org/conversion/data
      http://site.icu-project.org/charts/charset