Struppi: Falsch kodierten User-Input "retten"

Beitrag lesen

So langsam versteh' ich das Problem.

Na, zunächst ist der String in der Datei ja nur eine Bytefolge. Da die Datei angeblich (wie gesagt, Angabe im HTML-Meta-Tag) UTF-8-kodiert sein soll, versucht er diese auch als UTF-8 zu interpretieren.

Was mir noch nicht klar ist, was du mit interpretieren meinst. Wenn es nur darum geht die Zeichen anzuzeigen, kannst beim einbinden schon eine charset Angabe machen.

Also wenn du auf einer utf-8 Seite JS in Ansi einbindest, dann z.b. so:
<script src="ansi.js" charset="iso-8859-1"></script>

oder umgekehrt, wenn du utf-8 JS in eine mit ISO Kodierte Seite einbindest, dann eben so:
<script src="utf8.js" charset="utf-8"></script>

Dann werden zumindest die Sonderzeichen richtig angezeigt.

Ob dann aber alle String Funktionen ordnungsgemäß funktionieren, hab ich nicht ausprobiert.

Das Problem ist aber, dass dein Szenario so klingt, als ob alles passieren kann. Also jegliche denkbare Kombination der Zeichensätze. Und das 100% zu abzudecken dürfte unmmgöich sein.

Struppi.