Joachim: notepad++ 5.3.1

Hi,

arbeitet jemand mit notepad++ und weiss, obs normal ist, dass ich bei den Formaten nur ansi, utf-8 und ucs-2 zur Verfügung habe, jedoch keine iso-varianten? Gibts irgendwo Erweiterungen für andere Zeichencodierungen?

Gruesse, Joachim

--
Am Ende wird alles gut.
  1. Hi Joachim,

    arbeitet jemand mit notepad++

    ich arbeite _nur_ mit notepad++ und bin sehr glücklich mit dem Editor.

    und weiss, obs normal ist, dass ich bei den Formaten nur ansi, utf-8 und ucs-2 zur Verfügung habe, jedoch keine iso-varianten? Gibts irgendwo Erweiterungen für andere Zeichencodierungen?

    Aber utf-8 reicht doch, oder? Damit kannst Du ja darstellen, was Du willst.

    Es gab hier übrigens Anfang Februar einen Thread zuum Thema notpad++ und Zeicheneingabe.

    Mit lieben Grüßen aus Wien

    Michi

    --
    Self-Code: ie:{ fl:| br:> va:} ls:# fo:| rl:° n4:# ss:| de:> js:{ ch:? mo:) zu:}
    Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    It is nice to be important - but it is more important to be nice.
    1. Hi Jochim,

      ich habe zB. mit notepad++ (unter Verwendung von utf-8) soeben diese Beispielseite geschrieben und wie Du siehst, wird der Text (was immer das auch heißen mag, ich hab das von irgendwelchen anderen Seiten kopiert) problemlos dargestellt.

      Mit lieben Grüßen aus Wien

      Michi

      --
      Self-Code: ie:{ fl:| br:> va:} ls:# fo:| rl:° n4:# ss:| de:> js:{ ch:? mo:) zu:}
      Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
      It is nice to be important - but it is more important to be nice.
      1. Hallo,

        diese Beispielseite [...] problemlos dargestellt.

        mag bei dir vielleicht sein. Was wirklich angezeigt wird, hängt davon ab, ob das system den users die zeichen kennt.
        Die rechner hier in der schule stellen den Chieneesischen Teil nur als Vierecke dar.
        Nur weil das bei dir dargestellt wird, muss das also noch lange nicht bei jedem User so sein :)

        MfG. Christoph Ludwig

        --
        Wo die Sprache aufhört, fängt die Musik an...
        Selfcode:  sh:) fo:) ch:° rl:( br:^ n4:} ie:{ mo:} va:) js:| de:] zu:) fl:( ss:| ls:~
        Go to this
        1. Hi Christoph Ludwig,

          Die rechner hier in der schule stellen den Chieneesischen Teil nur als Vierecke dar.

          und dabei handelt es sich um welchen Browser?

          Mit lieben Grüßen aus Wien

          Michi

          --
          Self-Code: ie:{ fl:| br:> va:} ls:# fo:| rl:° n4:# ss:| de:> js:{ ch:? mo:) zu:}
          Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
          It is nice to be important - but it is more important to be nice.
          1. und dabei handelt es sich um welchen Browser?

            Das hängt nicht unbedingt vom Browser ab sondern vielmehr ob die Gylphen in der Schriftart vorhanden sind. Bei einer Standard-Windows-Installation wird die Unterstützung für Exotische meistens nicht dazuinstalliert und muss manuell erfolgen.

            1. Hi suit,

              Das hängt nicht unbedingt vom Browser ab sondern vielmehr ob die Gylphen in der Schriftart vorhanden sind. Bei einer Standard-Windows-Installation wird die Unterstützung für Exotische meistens nicht dazuinstalliert und muss manuell erfolgen.

              also ich sitze hier gerade in einem Café, wo in der Ecke ein einzelner Computer samt Internetanschluß steht. Das System hier ist vor längerer Zeit von wem aufgesetzt worden, der davon nicht viel mehr Ahnung hat als meine Großmutter. Hier gibt es keinen Firefox, kein Java, kein Flash und nur den IE 7. Und hier ist _ganz bestimmt_ nicht _Irgendwas_ zusätzlich installiert worden. Viele Seiten sind mit diesem Drecks-PC hier nicht mal darstellbar!

              Trotzdem wird die Seite korrekt angezeigt. Sogar die utf-8 Codierung wird korrekt übernommen und muß nicht manuell eingestellt werden.

              Genau das wäre ja der große Vorteil von utf-8, dass so viele verschiedene Zeichensätze darstellbar sind. Es ist mir ein Rätsel, wieso das woanders nicht funktionieren sollte. Aber vielleicht meldet sich dazu ja noch dedlfix, unser absoluter Kodierungsexperte zu Wort.

              Mit lieben Grüßen aus Wien

              Michi

              --
              Self-Code: ie:{ fl:| br:> va:} ls:# fo:| rl:° n4:# ss:| de:> js:{ ch:? mo:) zu:}
              Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
              It is nice to be important - but it is more important to be nice.
              1. Genau das wäre ja der große Vorteil von utf-8, dass so viele verschiedene Zeichensätze darstellbar sind.

                Genau gesagt sind mit UTF-8 nicht viele verschiedene Zeichensätze darstellbar - mit UTF-8 ist sind genau Unicode und ASCII darstellbar.

                Der Vorteil ist schlichtweg, dass UTF-8 mit einer einfach lesbaren und trotzdem relativ Platzsparenden 8-bit-Multibyte-Codierung arbeitet. UTF-32 wäre zwar einfacher lesbar, aber nicht platzsparender. UTF-16 ist nur in Sonderfällen platzsparender und auch nicht "einfacher" zu lesen. UTF-7 ist aufgrund der 7-bit-Codierung ebenfalls etwas unpraktisch.

                Die ISO-8859-Familie hat einen theoretischen Zeichenvorrat von 2^12 (4096) Zeichen (wobei die unteren 7 bit jeweils 16x vorhanden sind) während Unicode theoretisch etwa 1 Million mal mehr Zeichen (2^32) haben konnte.

                Aufgrund der Singlebyte-Codierung der ISO-Familie ist es allerdings nur möglich jeweils 2^8 Zeichen (256) gleichzeitg zu verwenden - das schmälert den potentiellen Zeichenvorrat nochmal. Zudem ist es in einem Dokuement nicht möglich Zeichen oberhalb von 0xA0 aus zwei verschiedenen Zeichensätzen zu verwenden.

                Es ist mir ein Rätsel, wieso das woanders nicht funktionieren sollte.

                UTF-8 ist ein (die) Unicode-Zeichentransformationsmethodem,d.h. wenn du ein mit UTF-8 codiertes Dokument darstellst, wird dein Browser/System versuchen, das entsprechende Unicode-Zeichen mit der entsprechenden Schriftart darzustellen. Sollte das nicht gelingen, wird versucht eine ersatzzeichen aus einer anderen Schriftart derselben Familie zu wählen (oder aus einer ganz anderen Fallback-Schriftart). Wenn auf keinem dieser Wege ein Zeichen, wird ein Platzhalter-Zeichen angezeigt - ein Fragezeichen, ein Kästchen oder sonstwas.

                Alles in allem:
                Was der OP wollte, ist es nicht viele verschiedene Zeichen darzustellen sondern die Codierung bei der Darstellung im Editor zu verändern.

                Wenn man in Notepad++ in einem ANSI-Dokument "ä" eingibt, gibt es afaik keine Möglichkeit, die Zeichencodierung so umzustellen, dass dort ein ф angezeigt wird. Notepad++ verwendet scheinbar die Codierung des Betriebssytems - also z.B. Windows-1252

                ---

                Natürlich ist UTF-8 die schlauere Wahl - aber es gibt durchaus Situationen, in denen man nur einen 8-bit-Singlebyte-Codierung verwenden kann.

                1. Hi suit,

                  Was der OP wollte, ist es nicht viele verschiedene Zeichen darzustellen sondern die Codierung bei der Darstellung im Editor zu verändern.

                  OK, das hab ich dann falsch verstanden. Danke trotzdem für Deine interessanten Ausführungen!

                  Mit lieben Grüßen aus Wien

                  Michi

                  --
                  Self-Code: ie:{ fl:| br:> va:} ls:# fo:| rl:° n4:# ss:| de:> js:{ ch:? mo:) zu:}
                  Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
                  It is nice to be important - but it is more important to be nice.
                2. Moin.

                  UTF-16 ist nur in Sonderfällen platzsparender und auch nicht "einfacher" zu lesen.

                  UTF-16 erlaubt es, die 'Basic Multilingual Plane' als einzelnen 16-bit Wert darzustellen. Für asiatische Sprachen ist deshalb UTF-16 durchaus "einfacher" als UTF-8.

                  [...] während Unicode theoretisch etwa 1 Million mal mehr Zeichen (2^32) haben konnte.

                  Unicode definiert 17 Ebenen à 2^16 code points, d.h. es reichen 21 Bit zum Kodieren. Dabei ist zu beachten, dass bisher lediglich 6 der 17 Ebenen überhaupt zugewiesen sind.

                  Christoph

                  1. UTF-16 erlaubt es, die 'Basic Multilingual Plane' als einzelnen 16-bit Wert darzustellen. Für asiatische Sprachen ist deshalb UTF-16 durchaus "einfacher" als UTF-8.

                    Ja, aber wann hat man schon Texte die nur aus entsprechenden Zeichen bestehen? Wohl eher selten, da die meisten Formate irgendwelche Markup-Informationen beinhalten - darum sagte ich ja, dass es nur in Sonderfällen platzsparender ist.

                    1. Moin.

                      Ja, aber wann hat man schon Texte die nur aus entsprechenden Zeichen bestehen? Wohl eher selten, da die meisten Formate irgendwelche Markup-Informationen beinhalten - darum sagte ich ja, dass es nur in Sonderfällen platzsparender ist.

                      UTF-8 kodiert ASCII-Zeichen mit einem Byte, dafür alle Zeichen der BMP ab U+0800 mit 3 Byte. UTF-16 benötigt in beiden Fällen 2 Byte. Sobald der eigentliche Text meht Zeichen enthält als das Markup, ist UTF-16 die 'sparsamere' Kodierung.

                      Christoph

                      1. UTF-8 kodiert ASCII-Zeichen mit einem Byte, dafür alle Zeichen der BMP ab U+0800 mit 3 Byte. UTF-16 benötigt in beiden Fällen 2 Byte. Sobald der eigentliche Text meht Zeichen enthält als das Markup, ist UTF-16 die 'sparsamere' Kodierung.

                        In den meisten Fällen dürfte bei Webseiten der Markup-Anteil aber den Nutztext überwiegen (verstärkt durch schlechte Programmierung, Redundanzen und Inline-CSS/-JavaScript). Bei der chinesischsprachigen Wikipedia-Startseite ist das Verhältnis von Markup zu Nutztext etwa 10:1 - beim Artikel über den Zweiten Weltkrieg immerhin noch etwa 3:1.

              2. Hallo

                ... Es ist mir ein Rätsel, wieso das woanders nicht funktionieren sollte.

                Ganz einfach dehalb, weil die auf dem System vorhandenen Schriftarten diese Zeichen nicht enthalten. Nicht alle Schriftarten, auch wenn sie UTF-8-kodiert sind, enthalten alle in UTF-8 möglichen Zeichen.

                Tschö, Auge

                --
                Die deutschen Interessen werden am Liechtenstein verteidigt.
                Veranstaltungsdatenbank Vdb 0.3
          2. Hallo,

            und dabei handelt es sich um welchen Browser?

            Firefox 3.0.1 und
            IE 7.0.5730.13

            auf dem laptop hätte ich noch firefox 3.0.10 und 6 weitere browser ... nur der darf hier in der schule kein internet haben ... :(

            MfG. Christoph Ludwig

            --
            Wo die Sprache aufhört, fängt die Musik an...
            Selfcode:  sh:) fo:) ch:° rl:( br:^ n4:} ie:{ mo:} va:) js:| de:] zu:) fl:( ss:| ls:~
            Go to this
    2. Hi,

      Aber utf-8 reicht doch, oder?

      nein leider nicht, vor allem zum Arbeiten in älteren Systemen mit anderen Encodings, ich will schliesslich nicht alles umkodieren. Ich bin da auch sehr von BBedit (Mac) verwöhnt, der sich nicht nur beliebig umstellen lässt und bei unpassenden Zeichen warnt, sondern auch per "reopen as" konvertiert.

      Gruesse, Joachim

      --
      Am Ende wird alles gut.