dedlfix: Zeichenkodierung finden

Beitrag lesen

Tach!

Auffällig ist gerade, dass die falschen Zeichen bei Win-1252 im Bereich 80..9F liegen, der bei ISO-8859-1 nicht definiert ist. Die richtigen Zeichen sind da nicht drin. Die Hexwerte sind aber andere. Also Beispiel: ™ gibts nicht in ISO-8859-1, in Win-1252 ist es 99, aber in meiner Hex-Wurst ist es D9. (Ich bin aber noch nicht durch mit dem Suchen aller Nicht-ASCII-Zeichen.)

Von dieser Regel gibt es nur eine Ausnahme: ƒ. Ich bin vorläufig fertig mit dem Thema. Stand ist, dass die Kodierung CP850 ist, aber Zeichen, die in Windows-1252 zwischen 80 und 9F liegen, sind anstelle einiger Rahmenzeichen platziert. Hier die vollständige Tabelle der Abweichungen zu CP850: links die Bytewerte, die ich bekomme, rechts die Werte der entsprechenden Windows-1252-Zeichen. (Die Leerzeilen sind die entsprechenden Fehlstellen in Win-1252.)

B0, 80

B2, 82

B3, 84
B4, 85
B9, 86
BA, 87
BB, 88
BC, 89
BF, 8A
C0, 8B
C1, 8C

C3, 8E

C8, 91
C9, 92
CA, 93
CB, 94
CC, 95
CD, 96
CE, 97
D5, 98
D9, 99
DA, 9A
DB, 9B
DC, 9C

F2, 9E
FE, 9F

dedlfix.