Moin,
kann mir jemand kurz und bündig den Unterschied
zwischen System nicht gleich UTF-8 anstatt ISO-8859-1. erklaeren:
Der Satz ergibt keinen Sinn. Sei's drum:
UTF-8 (Unicode Transport Format, wenn ich mich recht erinnere) ist lediglich eine Möglichkeit Unicode zu kodieren. Normalerweise braucht man 16 Bit um Unicode zu transportieren, bei UTF-8 werden dann aber Folgen von 8Bit-Zeichen verwendet. Die Zeichen 0-127 sind ganz normal ASCII, aber alles was der höchstwertige Bit gesetzt hat, gehört dann zur Codierung. Damit das ganze richtig Spassig wird, sind Unicode-Zeichen in UTF-8 repräsentiert auch noch unterschiedlich lang (-> http://www.cl.cam.ac.uk/~mgk25/unicode.html#utf-8).
ISO-8859-1 ist ein Zeichensatz, der für 8Bit-Zeichen (also 0-255) festlegt, welche Zeichen auf welchen Positionen liegen - die Zeichen 0-127 entsprechen übrigens auch ASCII - und wird für Westeuropa und Amerika verwendet (-> http://selfhtml.teamone.de/inter/zeichensaetze.htm).
Der Unterschied kurz und bündig: UTF-8 legt eine eineindeutige Abbildung von einem Strom von 8bit-Zeichen auf einen Strom von 16bit-Zeichen fest. ISO-8859-1 ist ein Zeichensatz.
-in einer Sprachübersetzung für eine Software hab´ ich ältere Übersetzungen gesehen, wo mit äöü-Zeichen nach der alten Schreibweise mit auml;öü eingefügt....sind.
Das sind HTML-Entities und haben weder mit UTF-8 noch mit ISO-8859-1 was zu tun.
Meine FRAGEN; Sind dies denn Zeichen fuer systematische Änderungen ----:
?
Was ist der grundsätzliche Vorteil von UTF-8 gegenüber ISO 8859-1?
Äpfel. Birnen.
Kann ich vielleicht bei UTF-8 irgendwie sorgloser dann übersetzen weil die decodierung (in php) schon alles wieder richtig macht?
?
--
Henryk Plötz
Grüße aus Berlin