Gunnar Bittersmann: XML-Deklaration

Beitrag lesen

Ich bin mir nun ganrnicht so sicher, ob ich meine Seite
überhaupt in XHTML machen soll/muss.

Ingo,
Du kannst deine Seiten auch in HTML 3.2 machen; aber das willst du ja nicht.

XHMTL 1.0 zwingt dich gegenüber HTML 4.01 zu genauerer Schreibweise: keine Endtags weglassen, Attributwerte immer in Gänsefüßchen, Groß-/Kleinschreibung. Da du mit den strengeren Regeln vertraut bist, spricht nichts gegen XHTML, im Gegenteil.

Ich versuche eigentlich immer möglichst wenig bzw. keine
Sonderzeichen wie z.B. € zu benutzen, sondern anstall lieber "EUR" zu schreiben.

Damit bist du auf der sicheren Seite. Ich verwende allerdings bedenkenlos „ “ – … €; die Systeme, die das nicht darstellen können, dürften heutzutage in der verschwindenden Minderheit sein.

Ist es denn im Grunde so, wie ich es jetzt habe,
vollkommener Unsinn?

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1" />

Zu den Problemen damit hat [molily] ja ausführlich geschrieben.

Bei XHML also
• entweder Codierung in ISO 8859-1 mit Angabe der Codierung in der XML-Deklaration, die hier notwendig ist und IEs in den QUirksmodus schickt
• oder Codierung in UTF-8 mit Angabe der Codierung in der HTTP-EQUIV-Angabe; die XML-Deklaration kann entfallen.

(Und der Server muss im HTTP-Header die richtige Codierung oder gar keine angeben.)

Wenn ich nun UTF-8 verwende, muss doch auch mein html-Editor die Seiten in UTF-8 speichern

Äh, n(j)ein. Du könntest auch "ä" in den Quelltext schreiben und den ISO-8859-1-codiert speichern. Dann steht die Oktettfolge C3 A4 im Dokument ("Ã" ist C3 in ISO 8859-1; "¤" ist A4). Sagst du nun einer verarbeitenden Sofware, das Dokument sei als UTF-8 zu interpretieren, ist C3 A4 ein "ä".

Aber besser ist natürlich, du schreibst "ä" und speicherst als UTF-8. Was steht dann für "ä" (wenn du das mit einem Hex-Editor anschaust)? Die Oktettfolge C3 A4.

und mein FTP-Programm die dann in UTF-8 auf den Webspace meines Providers hochladen ... richtig?

Das FTP-Programm sollte damit gar nichts zu tun haben. Das verändert beim Dateityp A noch die Zeichen für Zeilenumbrüche ja nach System (0D 0A, nur 0D bzw. nur 0A), sollte aber alle anderen Zeichen unverändert lassen.

Und dann muss ich doch auch noch per .htacess-Datei […]

(o.a. Möglichkeiten der Serverkonfiguration)

[…] dafür sorgen, dass der Server meines Providers die Dateien UTF-8 codiert an die Browser der User ausliefert.

Oder dass der Server gar keine Angabe zur Codierung macht. Dann kommt die XML-Deklaration / die HTTP-EQUIV-Angabe ins Spiel.

Live long and prosper,
Gunnar

--
„Weisheit ist nicht das Ergebnis der Schulbildung, sondern des lebenslangen Versuchs, sie zu erwerben.“ (Albert Einstein)