UTF-8 Umlaute werden nicht dargestellt
bearbeitet von Rolf BHallo hmm,
nein, das sind keine Metadaten. Metadaten wären Zusatzinformationen, die irgendwo außerhalb der Datei gespeichert werden.
Das Encoding steuert, wie die ZEICHEN, die Du auf dem Bildschirm siehst, als BYTES in der Daten abgelegt werden. Ob also ein ä als ein Byte mit dem Wert 0xE4 dargestellt wird (Latin-1 Codepage) oder UTF-8 codiert als zwei Bytes mit \xC3 \xA4 (hoffe, mein in-head UTF-8 Encoder hat sich jetzt nicht geirrt).
Um UTF-8 zu erkennen, verwenden manche Editoren ein spezielles Signalzeichen, das BOM (Byte Order Mark), das bei UTF-8 aus 3 Bytes mit den Werten 0xEF 0xBB 0xBF besteht. Es repräsentiert das Unicodezeichen U+FEFF (ZERO WIDTH NO-BREAK SPACE).
_Rolf_
--
sumpsi - posui - clusi