dedlfix: UTF-8 abgespeichert aber Ansi erkannt *beantwortet

Beitrag lesen

Tach!

Ja an so was hatte ich gedacht, aber wenn ich das jetzt richtig verstanden habe, dann hätte alles was man am Binärcode einer textbasierten Datei ändert, eine Auswirkung auf deren Inhalt.

Keinerlei Dateien haben irgendeinen Schutz, gegen Änderungen ihres Inhalts. Solange dir nicht das Betriebssystem den Zugriff verwehrt, kannst du mit ihnen machen, was du willst.

Keine seperaten Anweisungen zur Identifizierung möglich. Hört sich für mich nach Überraschungseier an ;-) und hätte ich jetzt nicht so erwartet. Dachte eher jede Datei hätte versteckte Infos, die keine Auswirkung auf den Inhalt haben.

Da es keine Garantie für einen bestimmten Inhalt geben kann, ist es im Prinzip immer Glückssache, was der lesende Prozess erkennt. Man hat da nur die Hoffnung, dass kein Mensch oder Prozess oder Hardware-Bug die Daten ändert.

Und so existieren lediglich ein paar Insellösungen, um eine Zeichenkodierung anzugeben. In HTML gibts ein Meta-Element, das ziemlich am Anfang notiert werden muss, und auch nur deshalb richtig gelesen werden kann, weil man annimmt, dass eine zu ASCII kompatible Kodierung verwendet wird.

Was natürlich nichts bringt, wenn ich in bei einer Ansi-Datei UTF8 im <Meta> angebe.

Solange keine Zeichen oberhalb von U+007F vorkommen ist es egal, ob du ASCII oder ISO-8859-irgendwas oder UTF-8 angibst. Das ist in dem Fall alles zueinander kompatibel.

dedlfix.