dedlfix: Viersprachige Website // Unicode-Frage

Beitrag lesen

echo $begrüßung;

Jetzt müsstest Du mir noch ein wenig auf die Sprünge helfen... wie könnte das denn z.B. im Falle einer chinesischen Seite aussehen. ...

Die deutschen Inhalte sind mit den entsprechenden entities für Umlaute etc. versehen.

Wenn du die &Entities; verwendest brauchst du die Charset-Angabe nicht. Die wird nur benötigt, wenn die Zeichen "als Bytes" kodiert sind. Also wenn der Browser auf das Byte E4 trifft und daraus ein ä machen soll, dann muss er gesagt bekommen, dass das iso-8859-1 ist. Und wenn er bei C3 A4 ein ä darstellen soll, muss er wissen, dass das utf-8 ist.

Wie muß ich mir da die Vorgehensweise bei chinesische oder japanischen Schriftzeichen vorstellen?

Entweder du nimmst für Zeichen, die mit der aktuellen Kodierung nicht dargestellt werden können die &Entitiyschreibweise; - auch in den Formen € oder € denn nicht für jedes Zeichen gibt es eine Schreibweise mit einem Namen (€)

Oder du schreibst die Zeichen in den Texten "normal" und speicherst mit einem entsprechend fähigen Editor in der am besten geeigneten Kodierung ab, z.B. UTF-8.

Diese Kodierung muss nun der Server dem Client (Browser) mitteilen. Dafür gibt es entsprechende Angaben in den Header-Zeilen im HTTP-Protokoll.

HTTP-Header werden vor jedem Dokument mitgesendet. Darin stehen z.B. Angaben zur Länge, zum Content-Type und auch zum Charset. Beim Apachen wird diese Angabe mit der Konfigurationsdirektive AddDefaultCharset eingestellt. Wenn keine Angabe zum Charset im Header mitgesendet wurde, dann darf der Browser die Angabe im Meta-Tag auswerten.

echo "$verabschiedung $name";