Sebastian: UTF-8 und Reguläre Ausdrücke

Beitrag lesen

Hy,

ich verwende in einem Formular eine XML-Deklaration mit der Angabe UTF-8 für die Zeichenkodierung:

<?xml version="1.0" encoding="UTF-8"?>

Mit einer Funktion möchte ich über Reguläre Ausdrücke alle Zeichen aus einem Textfeld entfernen, die nicht zu "reg" gehören - also alles rausschmeißen, was kein Buchstabe oder Umlaut ist!

////////////////////////////////////

reg = /[^a-z\ä\ö\ü]/i;

wert = textfeld.value;

while (reg.test(wert))
wert = wert.replace(reg,'');

textfeld.value = wert;

////////////////////////////////////

Jetzt läuft es aber schon wieder mal was schief, das ich mir beim besten Willen nicht erklären kann:

mit einer IS0-Zeichenkodierung klappt das wunderbar

<?xml version="1.0" encoding="ISO-8859-1" ?>

mit der UTF-Zeichenkodierung fliegen dagegen auch die Umlaute raus.

UTF schließt doch die Umlaute mit ein, oder ?

Was muß ich tun, damit Script und UTF zusammenarbeiten - und vor allem - warum - arbeiten die beiden Komponenten nicht zusammen ?

Für einen Rat und Aufklärung sehr dankbar

Sebastian Wehner