suit: Fehlerhafte darstellung von Umlauten

Beitrag lesen

Die Unicode-Zeichen werden UTF-8-codiert in 1(!) bis 4 Oktetts (Bytes) dargestellt.

recht hast du - sie werden in 1 bis 4 bytes codiert, 2 bis 4 betrifft natürlich nur zeichen > 127 (also ausserhalb ascii)

Diese stehen bei UTF-8 nicht für einzelne ASCII-Zeichen.

klar stehen die bitfolgen nicht für einzelne ascii-zeichen, sie sind aber exakt gleich hinterlegt - alle zeichen von 0 bis 127 sind in utf-8 und ascii exakt gleich

Du bewegtest dich auf der falschen Ebene. Bytes sind das eine, Zeichen was anderes.

ist mir klar - aber da utf-8 nur eine transformation darwstellt, ist es bei einzelnen ascii-zeichen unerheblich, wie man die bitfolge mit der fertigen zeichentabelle vergleicht, die logik dahinter ist in beiden fällen aus gutem grund gleich (z.B. finden das alte ftp-clients die text nicht binär sondern als ascii übertragen sehr toll, da geht kein zeichen kaputt)

Im Windows-Notepad immer; in vernünftigen Editoren lässt sich das einstellen.

gibt auch genug kostenpflichtige, die das nicht können - den lustigen link zu adobes meinung dazu hab ich denke ich schon mal irgendwo gepostet