Mont_St_Michel: HTML-ENTITIES - UTF 8 -Turbulenzen.

Haben ISO-8859-1 und UTF-8

denn was zu tun mit HTML-entities zu tun - ich bin nicht sicher.-

neulich wurde hier wie folgt definiert.-

auml;öü eingefügt....sind. Das sind HTML-Entities und haben weder mit UTF-8 noch mit ISO-8859-1 was zu tun.

zu UTF 8 und ISO 8859-1:

Der Unterschied kurz und bündig: UTF-8 legt eine eineindeutige Abbildung von einem Strom von 8bit-Zeichen auf einen Strom von 16bit-Zeichen fest. ISO-8859-1 ist ein Zeichensatz.

mein problem;  ich muss eine software uebersetzten bzw. den Sprachfile;

in einer Sprachübersetzung für eine Software hab´ ich ältere Übersetzungen gesehen, wo mit äöü-Zeichen nach der alten Schreibweise mit auml;öü eingefügt....sind. Das sind HTML-Entities und haben weder mit UTF-8 noch mit ISO-8859-1 was zu tun.

ich brauch unbedingt nocht ein paar tipps;
in der Englischen orginal-Language sind ja keine entities drinne.

bitte um tipps -

gruss
mont st michel

  1. Hallo!

    ich brauch unbedingt nocht ein paar tipps;

    Wenn du den Zeichensatz angibst, dann kannst du dir normalerweise die Entities bis auf < > & und " sparen.

    Welchen Zeichensatz du angibst, wird von verschiedenen Faktoren bestimmt. Bei einem deutschsprachigen Text reicht ISO-8859-15 oder  aus, das unterstützt denke ich auch jeder Browser.

    Wenn du ein Anhänger der Unicodephilosophie bist, öfters Texte in mehreren Sprachen schreiben musst oder besonders korrekt sein willst und korrekte Anführungszeichen unten haben möchtest ohne sie als Entity zu definieren, dann solltest du dir einmal UTF-8 oder UTF-16 anschauen.

    Es gibt noch viele andere Zeichensätze, die für bestimmte Sachen interessant sind, beispielsweise chinesische, russische, etc. Wirklich vermeiden solltest du allerdings windows-1252.

    Natürlich kannst du auch weiterhin deine Umlaute und Sonderzeichen als Entity kodieren.

    emu
    [afaik]

    1. Hi!

      Welchen Zeichensatz du angibst, wird von verschiedenen Faktoren bestimmt. Bei einem deutschsprachigen Text reicht ISO-8859-15 oder  aus, das unterstützt denke ich auch jeder Browser.

      ISO-8859-15 dürften nur die neuesten Browser kennen. Es ist sinnvoller ISO-8859-1 zu verwenden, da ISO-8859-15 meines Wissens nach zusätzlich nur das Euro-Symbol enthält.

      Gruß Herbalizer

      1. Hi

        ich brauch unbedingt nocht ein paar Tipps; also html-Entities sind sozusagen nur fuer die Browerkompatibilität da - die Entities werden im BROWSER wieder retour verwandelt in lesbare Umlaute!? So
        jedenfalls hab ich das verstanden..: MEINE AUFGABE ISTS, den Zeichensatz anzugeben,... sozusagen dem Browser bekanntzumachen, damit der weiß wie er ubersetzten muss....btw...; da bei den beiden Zeichensätzten ISO 8895-1 oder UTF-8 sowieso beide!

        • Ähemmm, wenn das so ist: das mit dem verwendeten Zeichensatz, dass bei beiden Varianten ISO 888895-1 und UTF-8 die ersten 127 Zeichen dieselben ASCII-Zeichen sind dann ists die Wahl für welche ich mich entscheide:  egal zumindest für die deutsche SCHRIFT !!! DENN Die UMLAUTZEICHEN SIND ALLE IN diesen 127 Zeichen drinne.

        Die FRAGE nach den Zeichen ISO 8895-1 und UTF-8 sind also im Grunde fuer die Entities völlig unerheblich - oder
        »»»
        Wenn du den Zeichensatz angibst, dann kannst du dir normalerweise die Entities bis auf < > & und " sparen.
        Welchen Zeichensatz du angibst, wird von verschiedenen Faktoren bestimmt. Bei einem deutschsprachigen Text reicht ISO-8859-15 oder  aus, das unterstützt denke ich auch jeder Browser.
        »»»
        Zitat: "Wenn du ein Anhänger der Unicodephilosophie bist, öfters Texte in mehreren Sprachen schreiben musst oder besonders korrekt sein willst und korrekte Anführungszeichen unten haben möchtest ohne sie als Entity zu definieren, dann solltest du dir einmal UTF-8 oder UTF-16 anschauen."
        »»»

        gruss
        mont st michel

        1. Hallo!

          also html-Entities sind sozusagen nur fuer die Browerkompatibilität da - die Entities werden im BROWSER wieder retour verwandelt in lesbare Umlaute!?

          Oder Sonderzeichen, ja. Allerdings gibt es auch vier Entities, die HTML-eigene Zeichen maskieren. Diese müssen gesetzt werden, sonst gibt es Probleme bei der Interpretation.

          MEINE AUFGABE ISTS, den Zeichensatz anzugeben,... sozusagen dem Browser bekanntzumachen, damit der weiß wie er ubersetzten muss....btw...; da bei den beiden Zeichensätzten ISO 8895-1 oder UTF-8 sowieso beide!

          Nein, Entities funktionieren unabhängig vom verwendeten Zeichensatz.

          die ersten 127 Zeichen dieselben ASCII-Zeichen sind dann ists die Wahl für welche ich mich entscheide:  egal zumindest für die deutsche SCHRIFT !!! DENN Die UMLAUTZEICHEN SIND ALLE IN diesen 127 Zeichen drinne.

          Unsinn.

          <img src="http://selfhtml.teamone.de/inter/ascii.gif" border=0 alt="">

          Die FRAGE nach den Zeichen ISO 8895-1 und UTF-8 sind also im Grunde fuer die Entities völlig unerheblich - oder

          Was willst du eigentlich wissen?

          Am besten wäre es, du definierst einen ISO-8895-1-Zeichensatz und schreibst die Umlaute einfach normal.

          emu
          [und schrei nicht so]

  2. Moin, moin

    habe so ein ähnliches Problem.

    1. charset ... utf-8
    2. im Dokument dann die Unicode &...

    Funktionierte bei mir mit IE, N4/N6, Opera 5/6 und Mozilla. Bekomme aber neuerdings Rückinfos von Usern "die wo nur Müll sehen"

    ???

    [Habe das weiter unten schon mal gepostet, hat sich aber bisher leider noch keine erschöpfende Antwort ergeben :,,-( ]

    Vielleicht findet sich ja jemand der uns beide schlau macht !?

    MfG Andreas

    1. Hallo!

      1. charset ... utf-8
      2. im Dokument dann die Unicode &...

      Funktionierte bei mir mit IE, N4/N6, Opera 5/6 und Mozilla. Bekomme aber neuerdings Rückinfos von Usern "die wo nur Müll sehen"

      Ich nehme an, du verwendest ein Betriebssystem, das Unicode unterstützt, zum Beispiel Windows 2000.

      Tatsächlich sind aber sehr viele Windows 98 und Windows ME unterwegs, auch einige Linuxdistributionen haben Probleme. Manchmal sind auch keine entsprechenden Schriftarten vorhanden.

      emu
      [...]