dedlfix: Zeichenkodierung finden

Beitrag lesen

Tach!

besteht auch noch die Frage, mit welchem Tool Du dir das Gespeicherte anschaust?

Mit dem Microsoft SQL Server Management Studio. Der Inhalt vom Blobfeld wird mir als Hex-Wurst angezeigt. Da ist eine Fehlkodierung ausgeschlossen.

Probier mal die Codierung UCS-2.
Dazu würde auch meine Frage passen, ob es überhaupt Singlebyte-Code ist.

Ja, ist Single-Byte. UCS-2 ist es nicht. Zum einen sind da keine 00-Bytes, und selbst wenn ich sie mir hinzudenken würde, wäre 0084 kein ä.

Könnte nämlich auch sein, dass in der DB noch keine Verluste vorhanden sind, sondern die erst bei der Wiedersichtbarmachung auftreten. Aber das ist nur eine weitere der noch nicht auszuschließenden Ideen.

Das BLOB-Feld in der DB ist transparent. Ich bekomme die Zeichen genauso wieder raus und angezeigt, wie sie reingingen. Nur Umkodieren (von CP850) zu UTF-8 bringt halt richtige (z.B. Umlaute) und falsche Zeichen.

Auffällig ist gerade, dass die falschen Zeichen bei Win-1252 im Bereich 80..9F liegen, der bei ISO-8859-1 nicht definiert ist. Die richtigen Zeichen sind da nicht drin. Die Hexwerte sind aber andere. Also Beispiel: ™ gibts nicht in ISO-8859-1, in Win-1252 ist es 99, aber in meiner Hex-Wurst ist es D9. (Ich bin aber noch nicht durch mit dem Suchen aller Nicht-ASCII-Zeichen.)

dedlfix.