Sven Rautenberg: Nachtrag

Beitrag lesen

Moin!

Ich habe jetzt mal ein wenig experimentiert. .txt Datei  mit PHP geschrieben unter Voraussetzung  accept-charset="UTF-8".

Dabei ist mir aufgefallen Notepad zeigt das problemlos richtig an.
Wordpad hingegen ist nicht in der Lage die Umlaute darzustellen.

Das liegt vor allem daran, dass bei Textdateien das Problem nicht gelöst werden kann, die verwendete Codierung in der Datei mitzuspeichern. Das ist übrigens kein Problem, was nur UTF-8 hat, dieselben Probleme treten auch auf, wenn der Editor normalerweise ISO-8859-1 annimmt, und er ohne Hinweis auf z.B. ISO-8859-2 trifft. Da viele Zeichen in den zwei Codierungen identisch sind, fällt das Problem nicht sofort auf, man muß schon auf Sonderzeichen treffen, die anders codiert sind, um zu sehen, dass dort nicht die erwarteten, sondern ganz andere Zeichen stehen.

Bei HTML-Dateien kann und sollte man unbedingt die verwendete Codierung in ein Meta-Element schreiben und (was höhere Priorität hat) auch als HTTP-Header mit ausgeben. Dann weiß jeder interessierte Leseprozess, was Sache ist.

Der Viewer von Total-Commander erkennt es nicht automatisch und muss manuell umegstellt werden, wobei die anderen Filterfunktionen des Viewers zb. "entferne Tags" damit auf der Strecke bleiben. Also scheint es wohl doch, dass UTF-8 doch gewisse Nachteile mit sich bringt?

UTF-8 bringt Nachteile, wenn man Software verwendet, die mit UTF-8 nicht umgehen kann. Diese Software wird aber aussterben und kann schon heute durch vernünftige Alternativen ersetzt werden. Insofern ist UTF-8 also kein Nachteil, sondern nur vorteilhaft.

- Sven Rautenberg

--
"Love your nation - respect the others."