Geistiger Hohlraum: Codierung zurecht biegen

Beitrag lesen

Jedenfalls ist das Zeichen ä in der Datei ein "ä", das ü ein "ü" usw. Da steht dann also so etwas wie "kann für immer". Was ist das für eine Codierung?

utf-8. Kommt diese Frage jetzt alle zwei Tage?

Und kann ich das mit PHP möglichst einfach zurecht biegen damit ich mit den Daten weiterarbeiten kann?

utf8_decode(), dabei müsste aber das Eurozeichen und einige andere Zeichen verloren gehen (alles, was windows-1252 von iso-8859-1 unterscheidet).

Oder wie viele Sonderzeichen gibt es noch die mir dort unangenehme Überraschungen verursachen könnten?

Theoretisch ungefähr 1,1 Millionen, praktisch vielleicht eher zwischen 20 und 200, je nachdem, in welchen Sprachen und mit welchem Computer der Unicode-Text geschrieben wurde.

Vielleicht lässt Du die Datei einfach wie sie ist und stellst selber auf Unicode um. Jeder moderne Browser kann mit Unicode umgehen.