Gunnar Bittersmann: utf-8 bei ein paar hundert Dateien

Beitrag lesen

@@LX:

Ja, nur solche Dateien, die UTF-8-Zeichen enthalten

?? Es gibt keine „UTF-8-Zeichen“.

müssen auch als UTF-8 gespeichert werden.

Der Satz sollte heißen: Nur solche Dateien, die Nicht-ASCII-Zeichen* enthalten, müssen auch als UTF-8 gespeichert werden. Denn Zeichen mit Codepoints < x80 werden in ISO 8859 und UTF-8 identisch kodiert: durch ein Byte, dessen Wert der dem Codepoints entspricht.

Live long and prosper,
Gunnar

* Basic Latin, Bereich U+0020 bis U_007E plus Zeilenumbruch u.ä.

--
Erwebsregel 208: Manchmal ist das einzige, was gefährlicher als eine Frage ist, eine Antwort.