dedlfix: Zeichenkodierung finden

Beitrag lesen

Tach!

Ich hab da mal ein Problem. Ich suche die Zeichenkodierung …

Wozu musst du die finden?

Na, um sie richtig interpretieren zu können. In dem Fall, um sie nach UTF-8 übersetzen zu können.

Anstatt ewig auf der Suche zu sein, bist du vielleicht besser daran, wenn du:

Ja, erstmal schien es einfacher zu sein, die verwendete Kodierung zu verwenden, denn dann kann das Programm sich mit einem einzelnen Funktionsaufruf um die Umkodierung kümmern. Nur hat das mit CP850 nur teilweise zum Erfolg geführt.

  1. den Text als Windows-1252-codiert (oder auch Codepage-850-codiert) betrachtest,

CP850 ist nicht Windows-1252. Letzeres ist mit ISO-8859-1 verwandt. Ich fahre derzeit wegen der Umlaute mit CP850 am besten.

  1. alle Nicht-ASCII-Zeichen und Umlaute maskierst: s/[^ -~ÄÖÜäöü]/➡️$1⬅️/

Ich hab keinen HTML-Kontext und muss sie auf andere Weise finden. Aber das werde ich im Laufe des Tages hinbekommen.

dedlfix.