Axel Richter: Konvertierungsroutine MAC OS Latin nach UTF-8 gesucht! (Doppelposting)

Beitrag lesen

Hallo,

In UTF-8 werden dafür 2 Bytes in der folgenden Form benötigt...
  10xxxxx 10xxxxxx

Nein, das ist kein UTF-8. Eine UTF-8-Byte-Sequenz für ein Zeichen sieht für US-ASCII so:
     0xxxxxxx
und für Latin-1 (U0080 - U00FF), genauer für U0080 - U07FF so:
     110xxxxx 10xxxxxx
aus. Das steht hier http://de.wikipedia.org/wiki/UTF-8 aber auch so.

Für U0080 - U00FF (Latin-1) ergäbe sich:
    10000000 -
    11111111
    nnnnnnnn

... in die Du Deine Bits einfügst:
  10xxxnn 10nnnnnn

110xxxnn 10nnnnnn

Und die restlichen X werden durch Nullen aufgefüllt:
  10000nn 10nnnnnn

110000nn 10nnnnnn

viele Grüße

Axel