Hallo,
Probier doch mal "beta" aus Word oder ähnlichen direkt in ein HTML Dokument zu kopieren und dann per Javascript zu alerten, dann siehst du was ich meine.
Nö, da sehe ich das erwartete Verhalten.
Der wird dir entweder ein Viereck oder ein Fragezeichen alerten, im Dokument selbst wirds natürlich dennoch als "beta" dargestellt werden.
Seltsam. Wenn das eine funktioniert, also das Zeichen korrekt kodiert ist, sollte das andere auch funktionieren.
<script> alert("β"); </script>
<p> β </p>
Woran kann das nun liegen? Möglich ist, dass für das Beta kein Glyph im Font enthalten ist, der zum Rendern der Schrift im alert() benutzt wird. Das halte ich aber für unwahrscheinlich, die Windows-Systemschriften sollten das alle enthalten.
Daher bleibt meine Frage, kann ich Sonderzeichen innerhalb von Code irgendwie darstellen, damit ich diese dann parsen kann? Am besten mit Javascript, wobei Java auch ok wäre.
Du kannst Zeichen durch Escape-Sequenzen maskieren bzw. umschreiben. \uXXXX verweist in einem String auf das Zeichen mit der hexadezimalen Unicode-Nummer XXXX. Beispielsweise \u03B2 für β.
Im Grunde sollte diese Umschreibung aber nicht nötig sein, der Fehler muss irgendwo anders liegen. Mit »Java oder JavaScript« selbst kannst du das sicher nicht lösen. Wenn kaputter JavaScript-Code beim Browser angekommen ist, kann der auch keine korrekte Umwandlung durchführen (bzw. man kann keinen String mit JavaScript derartig umwandeln - entweder er ist korrekt, dann ist es müßig, oder er ist fehlerhaft kodiert, dann müsste man eine aufwändige Umwandlung vornehmen, für die JavaScript ungeeignet ist). Java läuft entweder serverseitig als JSP oder als Applet. Nur serverseitig könntest du Ersetzungen von Zeichen innerhalb von JavaScript durchführen.
Mathias