Moin!
Desweiteren hab ich nicht so wirklich eine Ahnung, wie ich schnell rausfinde, wie eine Datei abgespeichert ist. Mit welchem Programm/Editor läßt sich das auf einen Blick erkennen?
Das ist auch gar nicht so leicht. In einer Textdatei gibt es keinen Hinweis, man kann nur nachsehen ob die Texte lesbar sind. Um das automatisch zu machen muss ein Programm erkennen ob der Text lesbar ist. Das funktioniert vermutlich nur bedingt. (Ohne Hinweis welche Sprache oder Programmiersprache verwendet wird und die entsprechenden Wörterbücher oder zumindest Regeln sehe ich da eher keine Chance)
Das einzige, was man tun kann: Aus der Gesamtheit aller möglicher Codierungen diejenigen ausschließen, die es aufgrund von illegalen Bytewerten, die im Bytestrom vorkommen, nicht sein können.
Wenn danach noch mehr als eine Codierung übrig bleibt, muß man raten. Heuristische Methoden zur Ermittlung einer "wahrscheinlichsten" Codierung können allerdings immer fehlschlagen.
Bei der Ausgangslage "ISO-8859-1" vs. "UTF-8" allerdings hat man wieder bessere Karten. Alle Texte, bei denen die Bytes allesamt das 8. Bit nicht gesetzt haben, sind in beiden Codierungen identisch.
Und Texte mit Umlauten sind in der ISO-Form eindeutig identifizierbar, weil sie ungültiges UTF-8 darstellen. UTF-8 ist umgekehrt zwar gültiges ISO-8859-1, dürfte aber zumindest ziemlich charakteristische "Umlaute" enthalten - man kann also auch da raten.
- Sven Rautenberg
"Love your nation - respect the others."