Hallo
Ich bin mir hier nicht ganz sicher ob ich Dich richtig verstehe. Ist das so gemeint:
- *.txt liegt in UTF8 Codierung vor
- *.txt wird mit Editor geöffnet
- im Editor ist die Codierung ISO-8859-1 eingestellt
- Einstellung im Editor wird von ISO-8859-1 auf UTF8 geändert
- Datei wird mit der UTF8 Codierung gespeichert
Irgendwie passt das nicht. Dann würde doch keine doppelte Codierung vorliegen.
Die doppelte Kodierung liegt dann vor, wenn ein Text, der UTF-8-kodiert ist ein weiteres mal mit UTF-8 (um)kodiert wird. Was du beschrieben hast, ist die Korrektur einer Fehlinterpretation des Editors, ohne dabei den Inhalt der Datei zu ändern.
Das von dir beschriebene Szenario lässt sich mMn sehr schön im Notepad++ nachvollziehen, indem man ihm eine Textdatei z.B. mit Umlauten im Inhalt vorwirft und dann über den Menüpunkt "Kodierung" selbige zwischen den Werten hin und her schaltet. Der Editor fordert nach einer Änderung auch zum speichern der Datei auf, im Endeffekt ändert er aber nur seine Interpretation des Inhalts in der Ansicht.
Und auch wenn das Gunnar hier im Thread schon gesagt hat, sei noch einmal darauf hingewiesen, dass Textdateien keine Metadaten besitzen, die interpretiert oder fehlinterpretiert werden können. Die Editoren sind zur Ermittlung der Kodierung auf die Interpretation des Inhalts oder eigene Mechanismen der Speicherung von Metadaten ihnen bekannter Dateien, z.B. in Projektdateien angewiesen. Den ersten Mechanismus muss, den zweiten kann es geben.
Verstehe leider noch nichtd was was mit doppelte Codierung gemeint ist. Es ist doch garnicht möglich, dass eine Datei gleichzeitig zwei Codierungen verwendet?
Nein, das kann sie nicht. Eine Kodierung kann aber fälschlicherweise mehrfach vorgenommen werden.
Tschö, Auge
Wenn man ausreichende Vorsichtsmaßnahmen trifft, muss man keine Vorsichtsmaßnahmen mehr treffen.
Toller Dampf voraus von Terry Pratchett