Hallo
In UTF-8 werden Umlaute in 2 Byte umgewandelt (ein Zeichen kann in UTF-8 bis zu 4 Byte beanspruchen), dort haben Umlaute im Klartext nichts verloren.
Hä? Was hat das mit der variablen Bytezahl zu tun?
Um bei Deinem Beispiel zu bleiben; ein ü besteht in UTF-8 aus den beiden Bytes HEX(C3 BC).
Folgende Möglichkeiten hast du nun:
- Du kodierst Dein Dokument in ISO-8859-1 und darfst das ü in Klartext schreiben.
- Bei UTF-8 musst Du HEX(C3 BC) schreiben.
- In beiden Fällen kannst Du auch das Entity ü benutzen.
4. Das Dokument im Texteditor als UTF-8 abpeichern.
Ist das nicht die komfortabelste Methode?
Gruß