Hi,
Nach welchen Gesichtspunkten sollte man bei welchen Webprojekten welchen Zeichensatz verwenden?
das könnte hier in eine lange Diskussion ausarten. ;-)
Generell ist ISO-8859-1 (Windows-Bezeichnung: "Westeuropäisch ISO") sehr verbreitet und enthält die meisten Zeichen, die in mittel- und westeuropäischen Sprachen verwendet werden. Aber eben nicht alle.
Windows-1252 hat ein paar mehr, aber die Unterstützung außerhalb der Windows-Welt ist unsicher.
Mit UTF-8 bist du insofern fein raus, als damit Tausende von Zeichen darstellbar und definiert sind, aber es gibt eben immer noch eine Menge Software (vor allem im Windows-Bereich), die UTF-8 nicht unterstützt. Auch PHP tut sich da teilweise noch etwas schwer, bei den Stringfunktionen gibt es gelegentlich Stolperfallen.
Ich persönlich mag UTF-8 nicht, weil damit die Regel "Ein Byte, ein Zeichen", die für mich viele Jahre lang fast schon ein Dogma war, nicht mehr gilt; die Anzahl der Bytes pro Zeichen ist nicht einmal mehr konstant. Ein Zeichen wird hier mit bis zu 4 Bytes codiert. Das macht den Umgang mit UTF-8 aufwendiger als mit konstant-8bit-Codierungen und führt an den Übergabestellen u.U. zu Problemen, wenn eines der beteiligten Systeme kein UTF-8 kennt.
Wenn man aber durchgängig in ALLEN Komponenten (Editor, Webserver, PHP, ggf. Datenbank) konsequent UTF-8 verwendet, dürfte das die zukunftssichere Methode sein.
So long,
Martin
Moskito, ergo summ.