Rolf B: UTF-8 Umlaute werden nicht dargestellt

Beitrag lesen

Hallo hmm,

nein, das sind keine Metadaten. Metadaten wären Zusatzinformationen, die irgendwo außerhalb der Datei gespeichert werden.

Das Encoding steuert, wie die ZEICHEN, die Du auf dem Bildschirm siehst, als BYTES in der Daten abgelegt werden. Ob also ein ä als ein Byte mit dem Wert 0xE4 dargestellt wird (Latin-1 Codepage) oder UTF-8 codiert als zwei Bytes mit \xC3 \xA4 (hoffe, mein in-head UTF-8 Encoder hat sich jetzt nicht geirrt).

Um UTF-8 zu erkennen, verwenden manche Editoren ein spezielles Signalzeichen, das BOM (Byte Order Mark), das bei UTF-8 aus 3 Bytes mit den Werten 0xEF 0xBB 0xBF besteht. Es repräsentiert das Unicodezeichen U+FEFF (ZERO WIDTH NO-BREAK SPACE).

Ob SVN das richtig handhabt, musst Du ausprobieren. Manche Versionierungssysteme kommen mit einem Wechsel des Encoding nicht klar. Möglicherweise musst Du die Datei im SVN löschen und neu einchecken. Möglicherweise musst Du beim Einchecken das Encoding festlegen. Ich kenne SVN nicht, ich kann es Dir nicht sicher sagen.

Rolf

--
sumpsi - posui - clusi