Die Unicode-Zeichen werden UTF-8-codiert in 1(!) bis 4 Oktetts (Bytes) dargestellt.
recht hast du - sie werden in 1 bis 4 bytes codiert, 2 bis 4 betrifft natürlich nur zeichen > 127 (also ausserhalb ascii)
Diese stehen bei UTF-8 nicht für einzelne ASCII-Zeichen.
klar stehen die bitfolgen nicht für einzelne ascii-zeichen, sie sind aber exakt gleich hinterlegt - alle zeichen von 0 bis 127 sind in utf-8 und ascii exakt gleich
Du bewegtest dich auf der falschen Ebene. Bytes sind das eine, Zeichen was anderes.
ist mir klar - aber da utf-8 nur eine transformation darwstellt, ist es bei einzelnen ascii-zeichen unerheblich, wie man die bitfolge mit der fertigen zeichentabelle vergleicht, die logik dahinter ist in beiden fällen aus gutem grund gleich (z.B. finden das alte ftp-clients die text nicht binär sondern als ascii übertragen sehr toll, da geht kein zeichen kaputt)
Im Windows-Notepad immer; in vernünftigen Editoren lässt sich das einstellen.
gibt auch genug kostenpflichtige, die das nicht können - den lustigen link zu adobes meinung dazu hab ich denke ich schon mal irgendwo gepostet