Moin!
immer wieder komme ich auf Seiten, wo Umlaute oder fremdsprachliche Zeichen falsch dargestellt sind. Ich probiere dann immer herum mit allen möglichen Zeichencodierungen.
Gibt es eine Möglichkeit am Quelltext zu erkennen, wie die Seite codiert ist, wenn der Content-Type nicht angegeben ist?
Es gibt keine Möglichkeit, nur aufgrund der vorkommenden Bytes zu erkennen, welche Codierung verwendet wird.
Die einzige Methode besteht darin, durch Ausschlußverfahren festzustellen, welche Codierung garantiert nicht verwendet wurde. Und bei den übriggebliebenen Möglichkeiten muß man dann wohl oder übel statistische Methoden einsetzen, wenn mehr als eine Codierung übrig bleibt.
Der Quelltext von Firefox soll in dieser Hinsicht eine recht gut ratende Routine zur Auto-Erkennung der Zeichencodierung bieten.
- Sven Rautenberg
"Love your nation - respect the others."