Ashura: Parsen von Umlauten in UTF-8

Beitrag lesen

Hallo Sascha.

[1] In meiner Textdatei wo die Einträge des Gästebuchs gespeichert werden, werden jetzt Sonderzeichen in der Form ö oder ä gepeichert. Dadurch ist die Textdatei für mich nicht mehr so leicht lesbar, allerdings Zeigt der Browser die Umlaute/Sonderzeichen korrekt an. Könnte das in irgendwie problematisch werden?

Wenn du in in dieser Datei agierst, könntest du durchaus Zeichen beschädigen. Benutze besser einen Editor, der mit UTF-8 umgehen kann. Dein derzeitiger kann dies offenbar nicht, andernfalls würde auch er die Umlaute direkt anzeigen. Ein hervorragender Editor in diesem Bereicht ist Notepad2.

[2] Oder anders ausgedrückt: Macht es Sinn, mit Hilfe von regulären Ausdrücken die Formulareingaben nach Sonderzeichen zu durchkämmen und dann durch die HTML-Codierung zu ersetzen z.B. ö für das deutsche ö?

Sinn „machen“ kann es sicher nicht. Und nein, sinnvoll ist es auch nicht. Erstens wird der Code damit wiederum schwerer lesbar und zweitens hast du dich ja bereits für UTF-8 entschieden, wo du dir um dies keine Gedanken mehr machen musst (wenn die Technik mitspielt).

Einen schönen Sonntag noch.

Gruß, Ashura

--
sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:} fl:( ss:) ls:[ js:|
mathbr:del.icio.us/ mathbr:w00t/