molily: Zeichen zählen - Problem mit Umlauten

Beitrag lesen

Hallo,

Alle Dateien sind UTF-8.

Das spielt eigentlich keine Rolle mehr, wenn erst einmal alle Dateien eingelesen sind.

tinylen = ed.getContent().replace(/(<([^>]+)>)/ig,"").length;

Strings in JavaScript sind echte Ketten von Unicode-Zeichen, sie stellen deutsche Umlaute problemlos in einem Zeichen da.

"ö".length → 1

Problematisch wird das erst mit Zeichen außerhalb des Basic Multilingual Plane von Unicode:
http://mathiasbynens.be/notes/javascript-unicode
Dann ist der Wert von length ggf. inkorrekt.

Ich weiß natürlich nicht, was TinyMCE in getContent macht. Vielleicht wird ö durch &ouml; ersetzt? Schau dir den String einmal an, werden da irgendwelche Ersetzungen vorgenommen?

Mathias