iso-8859-1 contra UTF-8
Guillermo
- meinung
0 Sebastian Becker0 Guillermo0 Thomas J.S.0 Guillermo0 MichaelR0 Daniel Thoma
0 MudGuard
Hallo,
Welche Kodierung bevorzugt Ihr? Welche Argumente gibt es für das eine oder andere Format? Gibt es noch etwas besseres als die genannten Kodierungen? Wo sind die Navigatoren am kompatibelsten?
Warum muss ich die Kodierung zweimal angeben (einmal im xml-Kopf und einmal in der meta-content-type-Angabe)?
Für zahlreiche Anregungen wäre ich sehr dankbar.
Grüße
Guillermo
Hallo, Guillermo,
die Wahl der Kodierung erscheint mir als nicht so entscheidend. Z.Zt. würde ich aber sicherheitshalber noch mit iso-8859-1 und HTML 4.01 arbeiten. Dann mußt Du auch die Kodierung nur einmal angeben ....
Grüße,
Sebastian
die Wahl der Kodierung erscheint mir als nicht so entscheidend. Z.Zt. würde ich aber sicherheitshalber noch mit iso-8859-1 und HTML 4.01 arbeiten. Dann mußt Du auch die Kodierung nur einmal angeben ....
Mit XHTML1.0 hatte ich bislang übrigens in keinem Navigator nennenswerte Probleme. Lediglich der NE4.7 hatte manchmal Macken, aber auf den nehme ich ohnehin nur noch Rücksicht, wenn es die Darstellung in anderen Navigatoren nicht negativ beeinträchtigt oder der Quellkode dadurch nicht unsauber wird. Ist eben ein Navigator für Unverbesserliche (-: und glücklicherweise nur noch von einer kleinen Randgruppe verwendet.
Warum sollte man lieber mit iso arbeiten? Gibt es Navigatoren, die UTF-8 nicht, wohl aber iso beherrschen?
Hallo,
Warum sollte man lieber mit iso arbeiten? Gibt es Navigatoren, die UTF-8 nicht, wohl aber iso beherrschen?
Darum geht es nicht. Wenn du die Zeichensätze der ISO-Familien verwendest, kannst du die Zeichen die über die Werte der ASCII Zeichen liegen dirket notieren. Z.B. für Deutsch eben ä,ö,ü,ß etc.
Nimmst du dagegen z.B. UTF-8, muss du diese Zeichen entsprechend maskieren.
ISO verstehen die Browser leichter, bei Unicode hängt es auch vom OS und nicht nur vom Browser ab. z.B. Win98 ist nicht wirklich Unicode kompatible WinNT/2000 dagegen eher.
Außerdem, hängt auch vom Schriftart ab, ob diese die entsprechende Zeichen enthält.
Warum muss ich die Kodierung zweimal angeben (einmal im xml-Kopf und einmal in der meta-content-type-Angabe)?
Wo muss du es zwei mal angeben? Du hast nicht gesagt um was (xml, xsl, html sonst was) es geht?
Grüße
Thomas
Hallo,
Wo muss du es zwei mal angeben? Du hast nicht gesagt um was (xml, xsl, html sonst was) es geht?
Es geht um xhtml 1.0 transitional.
Grüße
Guillermo
Hallo Thomas,
Darum geht es nicht. Wenn du die Zeichensätze der ISO-Familien verwendest, kannst du die Zeichen die über die Werte der ASCII Zeichen liegen dirket notieren. Z.B. für Deutsch eben ä,ö,ü,ß etc.
Nimmst du dagegen z.B. UTF-8, muss du diese Zeichen entsprechend maskieren.
Aber hat dan nicht der Mac Probleme mit den deutschen Umlauten? Ich dachte Mac und Win haben diesbezüglich unterschiedliche Codepages, so dass ein Win-ä anders zum Ausdruck kommt, wenn's der Mac darstellen soll?
Grüße
Michael
Hallo Michael,
Aber hat dan nicht der Mac Probleme mit den deutschen Umlauten? Ich dachte Mac und Win haben diesbezüglich unterschiedliche Codepages, so dass ein Win-ä anders zum Ausdruck kommt, wenn's der Mac darstellen soll?
Nein, Windows hat Probleme, bzw. Microsoft, der meinte dass ihm die ISO-Zeichensätze nicht gut genug seien und deshalb Windows mit eigenen CodePages ausgestattet hat, die sich in eigenen Detail von den ISO-Zeichensätzen unterscheiden. Jüngste und gravierendste Beispiel ist das (Euro) Zeichen.
Grüße
Thomas
Hallo Thomas,
Nimmst du dagegen z.B. UTF-8, muss du diese Zeichen entsprechend maskieren.
Wieso sollte man die bei UTF-8 maskieren müssen? UTF-8 unterstüzt Umlaute doch ebenfalls.
Mangelde Unterstüzung der Browser/Betriebssystem könnte natürlich Probleme machen. Beim Mozilla/IE auf Linux/Win98 ist mir das allerdings noch nicht aufgefallen.
Grüße
Daniel
Hallo Daniel,
Mangelde Unterstüzung der Browser/Betriebssystem könnte natürlich Probleme machen. Beim Mozilla/IE auf Linux/Win98 ist mir das allerdings noch nicht aufgefallen.
Sogar Netscape 4 macht es, zumindest unter Linux.
Viele Grüße,
Christian
Hallo Daniel,
Nimmst du dagegen z.B. UTF-8, muss du diese Zeichen entsprechend maskieren.
Wieso sollte man die bei UTF-8 maskieren müssen? UTF-8 unterstüzt Umlaute doch ebenfalls.
Versuche mal:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>Untitled</title>
</head>
<body>
<p>ööööööö äääääääääää üüüüüüüüü ßßßßßßßß ÄÄÄÄÄÄÄÄ ÖÖÖÖÖÖÖÖ ÜÜÜÜÜÜÜÜÜ</p>
</body>
</html>
Grüße
Thomas
PS: bei mir macht das unter win98 kein einziger Browser mit.
Hallo Thomas,
PS: bei mir macht das unter win98 kein einziger Browser mit.
Vielleicht solltest Du es auch als Unicode speichern ;)
Wenn Du es als iso-... speicherst und dann behauptest, es sei utf-8 geht das freilich in die Hose.
Grüße
Daniel
Hallo Daniel,
PS: bei mir macht das unter win98 kein einziger Browser mit.
Vielleicht solltest Du es auch als Unicode speichern ;)
Wenn Du es als iso-... speicherst und dann behauptest, es sei utf-8 geht das freilich in die Hose.
Aber darum ging es ja.
Es ist ziemlich nutzlos sowas als Unicode zu speichern und dann irgendeine ASCII Zeichensalat zu bekommen.
Natürlich, wenn der Editor beim Spichern die entsprechende Ersetzungen (also hex. oder als dezimale Notierung, oder als HTML-Entities) macht, ist das ok.
So würde der Inhalt vom <p> z.B. als Unicode gespeichert werden:
<p>ööööööö
äääääääääää
üüüüüüüüü
ßßßßßßßß
ÄÄÄÄÄÄÄÄ
ÖÖÖÖÖÖÖÖ
ÜÜÜÜÜÜÜÜÜ
</p>
Grüße
Thomas
Hallo Thomas,
Natürlich, wenn der Editor beim Spichern die entsprechende Ersetzungen (also hex. oder als dezimale Notierung, oder als HTML-Entities) macht, ist das ok.
Das meinte ich nicht. Das wäre ja auch irgendwie sinnlos, dann utf-8 zu nehmen.
Ich meinte, dass man einen Editor braucht, der die nicht-Ascii-Zeichen auch korrekt speichert.
Ein ä hat ja in utf-8 zwei Byte wärend es in iso-... nur ein Byte hat.
Richtig kodiert sollte das dann auch tun.
Diese Seite ist utf-8 codiert. Mozilla unter Linux kommt damit schon mal klar unter Windows kann ich das im Moment leider nicht überprüfen:
http://www.google.de/search?q=äöü&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=
Grüße
Daniel
Hallo Daniel,
Ich meinte, dass man einen Editor braucht, der die nicht-Ascii-Zeichen auch korrekt speichert.
Diese Seite ist utf-8 codiert.
Ich meinte auch genau das ;-) :
<title>Google Suche: äöü</title>
Deshalb sollte man, solche zeichen richtig maskieren.
Grüße
Thomas
Hi,
Welche Kodierung bevorzugt Ihr? Welche Argumente gibt es für das eine oder andere Format? Gibt es noch etwas besseres als die genannten Kodierungen? Wo sind die Navigatoren am kompatibelsten?
Bevorzugen? Ich seh da eher die Frage der (technischen) Notwendigkeit...
Da fast alle Zeichen, die ich üblicherweise benutze, in der Kodierung ISO-8859-1 enthalten sind, sehe ich keinen Grund, eine andere Zeichenkodierung (z.B. Unicode) zu verwenden - die paar Vorkommen anderer Zeichen kann ich als HTML-Entities notieren. Und da mein Lieblingseditor Unicode leider nicht bzw. nur extrem eingeschränkt unterstützt, bleibe ich bei ISO-8859-1.
Müßte ich dagegen Seiten bauen, die zu einem großen Teil Zeichen enthalten, die nicht in einem der ISO-Zeichensätze enthalten sind, würde ich auf Unicode umsteigen. Ob ich dann UTF-8 oder UTF-16 wähle, würde ich wahrscheinlich schlicht und einfach anhand der erzeugten Dateigröße entscheiden - bei UTF16 brauchen (fast? [1]) alle Zeichen genau 2 Byte, bei UTF-8 braucht ein Zeichen bis zu 6 Byte.
Warum muss ich die Kodierung zweimal angeben (einmal im xml-Kopf und einmal in der meta-content-type-Angabe)?
Weil manche Browser die XML-Deklaration schlicht und einfach ignorieren, weil zu der Entstehungszeit der Browser XML noch nicht bekannt oder zumindest nicht relevant war (der IE sucht beispielsweise den DOCTYPE nur in der ersten Zeile, weil er nicht mit einer XML-Deklaration rechnet)
[1] es gibt ja auch die 100000-10FFFF, die sind ja wohl kaum in 2 Bytes unterzubringen...
cu,
Andreas
--
Der Optimist: Das Glas ist halbvoll. - Der Pessimist: Das Glas ist halbleer. - Der Ingenieur: Das Glas ist doppelt so groß wie nötig.
<http://mud-guard.de/?> <http://www.andreas-waechter.de/> <http://www.helpers.de/>