Tsames: Zeichen € bis Ÿ der iso-8859-Zeichensätze

Hallo Forum,

gibt es eigentlich wirklich einen triftigen Grund, die Zeichen € bis Ÿ der iso-8859-Zeichensätze _nicht_ zu verwenden? Vielleicht weiß ja jemand, ob es eine Browser/Betriebssystem-Kombination gibt, die diese Zeichen tatsächlich nicht oder falsch anzeigt. Meine Erfahrung ist, dass die Zeichen überall korrekt angezeigt werden. Unter DOS wird ja wohl niemand surfen :-)

Mir ist natürlich klar, dass es für die Zeichen auch entsprechende Unicode-Werte oder benannte Zeichen gibt. Mit den benannten Zeichen hat aber (natürlich) mal wieder Netscape 4.x Probleme, wohingegen Opera 5 beide Möglichkeiten nur vereinfacht anzeigt, also z.B. anstatt deutschen Anführungszeichen („ bzw. „) die normalen "quotation marks" oder aber — (bzw. —) als normalen Bindestrich, etc.

Klar wird sich das Problem mit der Zeit von alleine erledigen, aber wenn die "Steuerzeichen" 128-159 überall korrekt angezeigt werden, spricht ja eigentlich nichts dagegen (außer dem Validator!), diese vorerst zu verwenden, bis die alten Browser wirklich ausgestorben sind.

Nächtliche Grüße
Tsames

  1. hi

    gibt es eigentlich wirklich einen triftigen Grund, die Zeichen € bis Ÿ der iso-8859-Zeichensätze _nicht_ zu verwenden? Vielleicht weiß ja jemand, ob es eine Browser/Betriebssystem-Kombination gibt, die diese Zeichen tatsächlich nicht oder falsch anzeigt. Meine Erfahrung ist, dass die Zeichen überall korrekt angezeigt werden. Unter DOS wird ja wohl niemand surfen :-)

    in einem 7bit-System sind das keine Schrift- sondern Steuer-Zeichen. Heute ist soetwas völlig unteressant, aber das was es eben nicht, als diese Zeichensätze festgelegt wurden..

    Grüße aus Bleckede

    kai

  2. Hi Tsames,

    ich wollte einfach nur der Vollständigkeit halber erwähnt haben, dass Du mit Verwendung von € - Ÿ kein valides HTML bzw. XHTML schreiben kannst. Ob das für Dich ein triftiger Grund ist, darauf zu verzichten, musst Du selber entscheiden.

    Grüße,

    Utz

  3. Hi!

    gibt es eigentlich wirklich einen triftigen Grund, die Zeichen € bis Ÿ der iso-8859-Zeichensätze _nicht_ zu verwenden?

    Kurze Antwort: Ja.

    Lange Antwort:

    Meinst Du, Du willst die numerischen Zeichenreferenzen (numeric character references) verwenden? Das hiesse, dass Du sowas wie € direkt in den HTML-Text schreibst.

    Oder moechtest Du Zeichen verwenden, deren Byte-Position im verwendeten Zeichensatz (character encoding) zwischen 128 und 159 liegt? Du gibst also ein Zeichen auf Deiner Tastatur ein und Dein Texteditor ordnet diesem Zeichen eine Byte-Position in dem Bereich zu (genauso wie er die Byte-Position 65 zuordnet, wenn Du ein A eingibst).

    Nur fuer die zweite Variante ist der Zeichensatz, den Du in einem <META HTTP-EQUIV="Content-type"> angibst, ueberhaupt von Belang. Und da gilt fuer die iso-8859-Zeichensaetze, dass die erst bei 160 anfangen. Zeichen von 128 bis 159 gibt es da also gar nicht. Wenn Du mit so einem Zeichensatz Byte-Positionen in diesem ungueltigen Bereich verwendest, werden Deine Seiten sehr wahrscheinlich auf vielen Systemen verstuemmelt angezeigt. Und Du veranlasst andere Leute dazu, Programme namens Demoronizer (Ent-Idiotisierer) zu schreiben. Lies ruhig mal auf http://www.fourmilab.ch/webtools/demoroniser/, wie es dazu kommt.

    Angaben wie &#128; dagegen beziehen sich immer auf Unicode, unabhaengig von Deinem verwendeten Character Encoding. Die Zeichen 128 bis 159 findest Du auf http://www.unicode.org/charts/PDF/U0080.pdf (zweite Seite, erste beide Spalten). Wie Du siehst sind das alles Control characters, also Zeichen, die eine bestimmte Bedeutung haben, aber ueberhaupt nicht darstellbar sind, weil sie kein zugeordnetes "Bild" haben ("Glyph" genannt). Wenn ein Webbrowser da also irgendwas anderes als gar nichts oder einen Platzhalter hinmalt, dann ist er kaputt. Wenn Du sowas verwendest, verlaesst Du Dich auf einen Bug bzw. darauf, dass sich ein Bug in einer ganz bestimmten Weise aeussert. Das heisst, Du sabotierst Deine Seite mit einer Zeitbombe, denn je neuer die Browser, umso naeher sind sie an den Standards.

    So long

    --
    There are two major products that come out of Berkeley: LSD and UNIX. We don't believe this to be a coincidence.
        -- Jeremy S. Anderson

    1. Hi Calocybe,

      Meinst Du, Du willst die numerischen Zeichenreferenzen (numeric character references) verwenden? Das hiesse, dass Du sowas wie &#128; direkt in den HTML-Text schreibst.

      Das meinte ich! Also genau, wie ich sonst die Unicode-Werte eingebe.

      Angaben wie &#128; dagegen beziehen sich immer auf Unicode, [...] Wie Du siehst sind das alles Control characters, also Zeichen, die eine bestimmte Bedeutung haben, aber ueberhaupt nicht darstellbar sind, weil sie kein zugeordnetes "Bild" haben ("Glyph" genannt). Wenn ein Webbrowser da also irgendwas anderes als gar nichts oder einen Platzhalter hinmalt, dann ist er kaputt.

      Mir ist allerdings selbst noch nie ein Browser untergekommen, der hier Probleme macht, d.h. sie sind alle "kaputt" ;-)
      Aber im Ernst: die Steuerzeichen machen ja in einem HTML-File keinen Sinn, insofern waren diese Plätze ja tatsächlich frei und werden deshalb vom ANSI-Zeichensatz auch eigentlich gut genutzt. Dieser hat sich meiner Meinung nach als Quasi-Standard bei allen Browsern auf allen Betriebssystemen durchgesetzt (oder gibt es doch Gegenbeispiele?). Der HTML-Standard wird hier ja lediglich durch die ANSI-Zeichen ergänzt.

      Wenn Du sowas verwendest, verlaesst Du Dich auf einen Bug bzw. darauf, dass sich ein Bug in einer ganz bestimmten Weise aeussert. Das heisst, Du sabotierst Deine Seite mit einer Zeitbombe, denn je neuer die Browser, umso naeher sind sie an den Standards.

      Einen Bug würde ich es nicht unbedingt nennen, es ist wohl mehr eine freie Interpretation, was die Zeichenwerte bedeuten sollen. Aber da es alle Browser gleich interpretieren (nämlich als ANSI-Zeichensatzwerte), macht es in der Paxis ja auch keine Probleme. Der Standard wird dabei nicht sabotiert, da er hier wohl einfach eine Lücke hat. Ich kann mir nicht vorstellen, dass diese Zeichen im HTML-Standard wirklich für etwas anderes reserviert sind. Also gibt es auch keinen Grund, dass die Browser die Unterstützung hierfür irgendwann aufgeben sollten.
      <Wunsch>Vielleicht toleriert ja irgendwann sogar der Validator diesen Quasi-Standard!</Wunsch>

      PS: Sollte es doch auf irgendeinem System Probleme machen, weil ein Browser eben nicht den ANSI-Zeichensatz für diese Zeichen verwendet, lasse ich mich sofort vom Gegenteil überzeugen.

      Viele Grüße
      Tsames