Hi,
ich hab hier einen Text vorliegen, der seltsam codiert ist.
- ein großes Ä ist durch die Bytes C6 und 92 dargestellt (u0192 - kleines f mit Haken)
- ein kleines ä sieht so aus: e2 80 b0 (u2030 - Promillezeichen)
- ein kleines ö ist durch die Bytes C8 und 86 dargestellt (u02c6 - Modifier Circonflex)
- das große Ü kommt mit den Bytes E2 80 B9 daher (u2039 - Single leftpointing angle quotation)
- das kleine ü kommt mit den Bytes C2 und B8 daher (u00b8 - Cedille (ohne c))
Mehr nicht-ASCII-Zeichen hab ich noch nicht gefunden.
Durch welchen Codierungsunfall kann dieses "Encoding" zustandegekommen sein?
Keine Ideen? Doppelt von ISO- nach UTF-8-codiert ist's nicht, da wäre ja das A mit Tilde und ähnliches zu sehen …
cu,
Andreas a/k/a MudGuard