Gunnar Bittersmann: Charsets

Beitrag lesen

Hello out there!

Für meine vorherigen Seiten habe ich keinen Charset oder einfach ISO-8859-1 benutzt.

Was heißt „keinen benutzt“? Keine HTTP-EQUIV-Angabe? Schlecht.

Der Server macht keine Angabe im HTTP-Header? Akzeptabel, wenn eine HTTP-EQUIV-Angabe im Dokument vorhanden ist.

Keine HTTP-EQUIV-Angabe und keine Angabe im HTTP-Header? Ganz schlecht.

Kann ich jetzt für die polnische Seite den entsprechenden Charset einfügen (und welcher ist das?)?

Du könntest die polnischen Seiten in ISO 8859-2 codieren (d.h. die Dateien in dieser Codierung speichern), dieses auch so in der HTTP-EQUIV-Angabe angeben und den Server anweisen, wenn er im HTTP-Header eine Angabe macht, dann auch ISO 8859-2 anzugeben. Bspw. mit http://de.selfhtml.org/servercgi/server/htaccess.htm@title=.htaccess:

<Files foo.pl.html> # da der richtige Dateiname  
AddDefaultCharset ISO-8859-2  
</Files>

Besser wäre allerdings die Verwendung von UTF-8 – für sämltliche Seiten.  Diese Codierung taugt für alle Zeichen, auch '€', '„', '“', '…'

Als letzte Möglichkeit bliebe, die polnischen Zeichen als numerische Zeichenreferenzen zu notieren (&#x105; für ą U+0105); aber: “It is almost always preferable to use an encoding that allows you to represent the characters in their normal form, rather than using character entities or NCRs.” [QA-ESCAPES]

See ya up the road,
Gunnar

PS: <http://de.selfhtml.org/inter/sprache.htm@title=SELFHTML: Computer und geschriebene Sprache>

--
“Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)