Helge: Windows-Zeichensatz, Perl und HTML-Formulare - Urgs!?

Hi Ihr,

<praeambel>
Ich hasse Windoof. Wirklich.
</praeambel>

Folgendes Problem: Ein paar DAUs benutzen ein Formular, welches haufenweise Text an ein Perl-Script übergibt, welches den ganzen Schmonzes in XML-Dateien verpackt und speichert. Diese XML-Dateien werden bei Bedarf geparst und in das Formular zurückgeschickt, damit der User Änderungen an den von ihm gespeicherten Texten vornehmen und diese wieder speichern kann - soweit ist das noch kein Problem ;-)
Blöderweise benutzen diese User aber Windoof und haben die unangenehme Angewohnheit, aus Worddokumenten Textteile herauszukopieren und diese per Copy + Paste in das Formular einzusetzen. Da es sich bei diesen Usern u.a. um hyperintellektuelle Geisteswissenschaftler handelt, wandern auf diese Art und Weise jede Menge Zeichen in das Formular (und in die XML-Datei), die man beim besten Willen nicht ISO-8859-1 zuordnen kann (UTF kann ich nicht benutzen, weil immer noch der NS4 benutzt wird und die ganze Geschichte auf einem, hm, etwas angestaubten Perl laufen muß), z.B. 'oe' als Ligatur oder jede Menge komischer Bullets. Ein ordentlicher Valligator haut mir solche Zeichen natürlich um die Ohren - aber schlimm ist auch, was Nicht-Windoofs statt dieser ominösen Zeichen dann so anzeigen ...
Wie kriege ich Perl dazu, solche Zeichen ordentlich zu behandeln - dazu zähle ich auch das schlichte Beseitigen solcher M$-Monstrositäten ... ?

Danke für eure Geduld und viele Grüße

Helge

  1. Wie kriege ich Perl dazu, solche Zeichen ordentlich zu behandeln - dazu zähle ich auch das schlichte Beseitigen solcher M$-Monstrositäten ... ?

    Hat sich erledigt. Es ging nur um die Zeichen 127-159 in
    Windows-1252, die sich finden und ersetzen lassen - muß man
    eben erstmal rauskriegen.

    Konnte mir zwar niemand helfen, aber trotzdem danke ;-)

    Helge