Unbekannte Zeichen von Sven Rautenberg, 20.10.2006 12:19

Unbekannte Zeichen

Sven Rautenberg Homepage des Autors 20.10.2006 12:19

sonstiges

Moin!

immer wieder komme ich auf Seiten, wo Umlaute oder fremdsprachliche Zeichen falsch dargestellt sind. Ich probiere dann immer herum mit allen möglichen Zeichencodierungen.
Gibt es eine Möglichkeit am Quelltext zu erkennen, wie die Seite codiert ist, wenn der Content-Type nicht angegeben ist?

Es gibt keine Möglichkeit, nur aufgrund der vorkommenden Bytes zu erkennen, welche Codierung verwendet wird.

Die einzige Methode besteht darin, durch Ausschlußverfahren festzustellen, welche Codierung garantiert nicht verwendet wurde. Und bei den übriggebliebenen Möglichkeiten muß man dann wohl oder übel statistische Methoden einsetzen, wenn mehr als eine Codierung übrig bleibt.

Der Quelltext von Firefox soll in dieser Hinsicht eine recht gut ratende Routine zur Auto-Erkennung der Zeichencodierung bieten.

- Sven Rautenberg

--
"Love your nation - respect the others."

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Sven Rautenberg: Unbekannte Zeichen

Beitrag lesen

Unbekannte Zeichen

Unbekannte Zeichen