hotti: Alles generell in UTF-8 oder ?

tja,

siehe Thema. Speziell: Ich konstruiere gerade einen kleinen Webbaukasten, siehe Link ganz unten. Da gibt es ein Setup zum Einstellen von Attributen, die für neue Seiten übernommen werden, eins davon ist das Attribut "charset".

Es wäre ein bischen problematisch, wenn das veränderbar ist, insbesondere dann, wenn es schon Seiten mit einer bestimmten Zeichenkodierung gibt und es daneben und später Seiten mit einer anderen Kodierung geben soll. Außerdem wird im Setup auch die Kodierung für den Editor festgelegt...

Also, ich hab mir gedacht, ich lege das einfach auf UTF-8 fest. Oder mal andersrum gefragt: Gibt es eine Daseinsberechtigung für andere Charsets wie z.B. ISO-8859-1 usw.? Ist es eine gute Idee, das einfach auf utf-8 festzulegen?

Bitte mal um Hinweise,
Horst Heimchen

--
Woran ich gerade arbeite: http://rolfrost.de/cgi-bin/pico.cgi
  1. @@hotti:

    nuqneH

    Gibt es eine Daseinsberechtigung für andere Charsets wie z.B. ISO-8859-1 usw.?

    Nein, nicht wirklich. Evtl. UTF-16 für Sprachen, die mit Zeichen jenseits von U+07FF geschrieben werden.

    Und verwende bitte nicht den Begriff „Charset“, wenn du von Zeichencodierungen sprichst.

    Ist es eine gute Idee, das einfach auf utf-8 festzulegen?

    Ja.

    Qapla'

    --
    Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
    (Mark Twain)
    1. Danke Gunnar,

      Ist es eine gute Idee, das einfach auf utf-8 festzulegen?

      Ja.

      Danke nochma ;-)

      Horst Bitterbier

      --
      return "Content-Type: text/html; charset=$self->{charset}\n\n";
    2. Moin,

      Und verwende bitte nicht den Begriff „Charset“, wenn du von Zeichencodierungen sprichst.

      Ok, reden wir darüber ;-)

      Wenn ich einen korrekten HTTP-Header ausgeben will, muss ich den Begriff "charset" als Parameter verwenden, so stehts nunmal in den RFCs.

      Du kannst ja mal einen header like

      Content-Type: text/html; Zeichenkodierung=utf-8

      senden und schauen, was der Browser macht ;-)

      Viel Spaß beim Basteln,
      Horst Heimchen

      1. Und verwende bitte nicht den Begriff „Charset“, wenn du von Zeichencodierungen sprichst.

        Ok, reden wir darüber ;-)

        Wenn ich einen korrekten HTTP-Header ausgeben will, muss ich den Begriff "charset" als Parameter verwenden, so stehts nunmal in den RFCs.

        Ja - aber in der der englischen überlegenen deutschen Sprache haben wir "Zeichensatz" und "Zeichenkodierung" während man in der ebengenannten armseeligen Sprache nur "Charset" und "Character encoding" ... halt! Ein Fehler in den RFCs - könnte das zufall sein?

        Nein, viele RFCs haben Mängel - ich erinnere nur an HTTP_REFERER vs. "referrer" als korrekte schreibweise.

        1. Moin,

          Ja - aber in der der englischen überlegenen deutschen Sprache ...

          komisch, ich empfinde das genau umgekehrt - wenn ich präzise beschreiben und genau formulieren will, ist es meistens die deutsche Sprache, die da Defizite hat.

          Nein, viele RFCs haben Mängel - ich erinnere nur an HTTP_REFERER vs. "referrer" als korrekte schreibweise.

          Und das ist nicht einmal ein inhaltlicher Mangel, sondern da hatte vermutlich einer der Autoren Schwächen in der Rechtschreibung.

          Ciao,
           Martin

          --
          Die letzten Worte des Systemadministrators:
          Nur gut, dass ich ein intaktes Backup habe.
          Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
          1. Ja - aber in der der englischen überlegenen deutschen Sprache ...

            komisch, ich empfinde das genau umgekehrt - wenn ich präzise beschreiben und genau formulieren will, ist es meistens die deutsche Sprache, die da Defizite hat.

            Schau in den Quelltext- du wirst ein sarcasm-Element um meinen Beitrag finden :p

            Und das ist nicht einmal ein inhaltlicher Mangel, sondern da hatte vermutlich einer der Autoren Schwächen in der Rechtschreibung.

            Ja :)

          2. Moin Martin,

            heute morgen kam im SWR ein kleiner Beitrag zur Energiesparlampe. Die Jungs im Radio erklärten, dass zum Vergleich unterschiedlicher Birnen die eigentliche Lichtleistung auf der Packung stehen muss: in Lumen.

            Ich gleich ne Mail ins Studio geschickt, Lumen ist seit 30 Jahren out, gängig ist als Maßeinheit schon lange die Einheit Candela (Kerze).

            Naja, die hahm das dann auch gleich im Radio gebracht, also meine Mail und haben mir sogar geantwortet. Hab nochmal zurückgeschrieben:

            An SWR: vielen Dank für Deine Antwort. Wenn als Einheit "Lumen" anstelle "Candela" auf der Packung stehen muss, ja, da kannst Du mal sehen, wie diejenigen Leute, die das beschlossen haben hinterm Mond sind ;-)

            Lumen/Candela, das ist ungefär so wie Kalorien/Joule, das ist einfach nicht aus den Köpfen rauszukriegen, geht mir genauso *G

            Jow, und beim Begriff "Birne" kräuseln sich bei jedem Elektriker die Nackenhaare.

            Ergo: Alles schon dagewesen.

            Hotti

            PS: Machtoch Watt ihr wollt (danke Martin)

            Birne kaputt? Leg Eis auf.

            1. @@hotti:

              nuqneH

              Ich gleich ne Mail ins Studio geschickt, Lumen ist seit 30 Jahren out, gängig ist als Maßeinheit schon lange die Einheit Candela (Kerze).

              Lesen bildet.

              Lumen ist eine abgeleitete SI-Einheit und wohl keinesfalls out.

              Lumen und Candela sind Einheiten für verschiedene physikalische Größen. Es gilt: 1 lm = 1 cd · 1 sr (aber das weißt du ja inzwischen aus der Wikipedia).

              An SWR: vielen Dank für Deine Antwort. Wenn als Einheit "Lumen" anstelle "Candela" auf der Packung stehen muss, ja, da kannst Du mal sehen, wie diejenigen Leute, die das beschlossen haben hinterm Mond sind ;-)

              Wie lange willst du dich noch hinterm Mond verstecken? Komm doch endlich mal vor!

              Lumen/Candela, das ist ungefär so wie Kalorien/Joule

              Nicht mal annähernd.

              Und die beim SWR sind dir auf den Leim gegangen, anstatt selbst nochmal zu recherchieren. (Das kann man von Journalisten heutzutage wohl auch nicht mehr unbedingt erwarten.)

              PS: Machtoch Watt ihr wollt (danke Martin)

              Und den haste auch versaut. Das heißt vollständig: Ihr da ohm, macht doch watt ihr volt.

              Qapla'

              --
              Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
              (Mark Twain)
            2. Hallo,

              heute morgen kam im SWR ein kleiner Beitrag zur Energiesparlampe. Die Jungs im Radio erklärten, dass zum Vergleich unterschiedlicher Birnen die eigentliche Lichtleistung auf der Packung stehen muss: in Lumen.
              Ich gleich ne Mail ins Studio geschickt, Lumen ist seit 30 Jahren out, gängig ist als Maßeinheit schon lange die Einheit Candela (Kerze).

              dabei sind Candela und Lumen gar nicht verschiedene Einheiten für dieselbe physikalische Größe, aber immerhin sind sie voneinander abhängig. Und das Lumen ist sogar ebenfalls eine SI-Einheit (wenn auch eine abgeleitete).
              Der Lichtstrom (in lumen) ist nämlich die Lichtstärke (in candela) multipliziert mit dem Raumwinkel, in den das Licht abgestrahlt wird.

              Bei Lampen ist deshalb die Angabe des Lichtstroms in Lumen sogar korrekter und aussagekräftiger als die Lichtstärke in candela, denn ersterer ist bei gegebener Lichtquelle konstant, während letztere sich nahezu beliebig erhöhen lässt, wenn man das Licht bündelt, etwa mit einem Reflektor.

              Wenn als Einheit "Lumen" anstelle "Candela" auf der Packung stehen muss, ja, da kannst Du mal sehen, wie diejenigen Leute, die das beschlossen haben hinterm Mond sind ;-)

              Keineswegs.

              Lumen/Candela, das ist ungefär so wie Kalorien/Joule

              Keineswegs.

              Jow, und beim Begriff "Birne" kräuseln sich bei jedem Elektriker die Nackenhaare.

              Warum? Glühlampen werden nach ihrer Form benannt. Als Birnen, als Kerzen, als Sofitten, ...

              Ciao,
               Martin

              --
              Man ist so alt, wie man sich fühlt.
              Aber niemals so wichtig.
              Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
              1. hi,

                Wenn als Einheit "Lumen" anstelle "Candela" auf der Packung stehen muss, ja, da kannst Du mal sehen, wie diejenigen Leute, die das beschlossen haben hinterm Mond sind ;-)

                Keineswegs.

                Martin, Du hast Recht. Der Fehler liegt bei mir, ich hab das 'Lumen' mit 'Lux' verwechselt.

                Horst Hotdog

                --
                Wissen ist Macht. Nichts Wissen macht nichts, is mir wissentlich klar ;-)
                1. Hallo,

                  Wenn als Einheit "Lumen" anstelle "Candela" auf der Packung stehen muss, ja, da kannst Du mal sehen, wie diejenigen Leute, die das beschlossen haben hinterm Mond sind ;-)
                  Keineswegs.
                  Martin, Du hast Recht. Der Fehler liegt bei mir, ich hab das 'Lumen' mit 'Lux' verwechselt.

                  ah, na dann ...

                  Also einfach zusammengefasst:
                  Die Lumens geben an, wieviel Licht aus einer bestimmten Lichtquelle rauskommt.
                  Die Candelas geben an, wieviel davon in eine bestimmte Richtung scheint.
                  Und die Luxe geben an, wieviel Licht auf einer angeleuchteten Fläche ankommt.

                  Ciao,
                   Martin

                  --
                  Zwei Freundinnen tratschen: "Du, stell dir vor, die Petra kriegt ein Kind!" - "Ich kann mir schon denken, von wem." - "Dann ruf sie mal schnell an, das würde ihr bestimmt weiterhelfen."
                  Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
                2. @@hotti:

                  nuqneH

                  Der Fehler liegt bei mir, ich hab das 'Lumen' mit 'Lux' verwechselt.

                  Schon wieder #fail.

                  Auch das Lux ist eine abgeleitete SI-Einheit (einer noch anderen physikalischen Größe) und nicht „seit 30 Jahren out“.

                  Ich hatte dir zwei Links mit dem Zaunpfahl gegeben. Du hast sie missachtet?

                  Mach doch bitte mal deine Hausaufgaben, anstatt ständig irgendwelches Halbwissen zu verbreiten!

                  Qapla'

                  --
                  Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
                  (Mark Twain)
        2. hi Suit,

          Wenn ich einen korrekten HTTP-Header ausgeben will, muss ich den Begriff "charset" als Parameter verwenden, so stehts nunmal in den RFCs.

          Ja - aber in der der englischen überlegenen deutschen Sprache haben wir "Zeichensatz" und "Zeichenkodierung" während man in der ebengenannten armseeligen Sprache nur "Charset" und "Character encoding" ... halt! Ein Fehler in den RFCs - könnte das zufall sein?

          Nein, viele RFCs haben Mängel - ich erinnere nur an HTTP_REFERER vs. "referrer" als korrekte schreibweise.

          Es gibt noch mehr solche Unkorrektheiten, bzw. auch gerade im HTTP-Bereich Bezeichner, die missverständlich sind, z.B.:

          Content-Type: application/x-www-urlencoded
          Content-Type: multipart/form-data

          Das wäre ein Header im Request. In der Response jedoch (klar, wir wissen das), hat Content-Type eine andere Bedeutung:

          Content-Type: text/html
          Content-Type: text/plain; charset=ISO-8859-7
          Content-Type: image/gif

          usw. Für die Praxis ist das ohne Belang, mit sowas können sich die Theoretiker von mir aus zerfleischen, als Praktiker wende ich das an und gut ;-)

          Ich selbst übersetze "charset", das Wort, was es im Englischen gar nicht gibt (mal nebenbei angemerkt) als "Character Setting" und damit ist für meine Begriffe alles gesagt, was es dazu zu sagen gibt.

          Viele Grüße an Alle,
          heute ist ein schöner Täg!!!!

          Horst Haselhuhn

          --
          Ab in die Suppe ihr Hühner, aber vorher wird nochn Ei gelegt, is das klar!!!!
        3. Ja - aber in der der englischen überlegenen deutschen Sprache haben wir "Zeichensatz" und "Zeichenkodierung" während man in der ebengenannten armseeligen Sprache nur "Charset" und "Character encoding" ... halt! Ein Fehler in den RFCs - könnte das zufall sein?

          Zitat:
              „Eure vermeintliche gotische Verinnerlichung passt schlecht in das Zeitalter von Stahl und Eisen, Glas und Beton, von Frauenschönheit und Männerkraft, von hochgehobenem Haupt und trotzigem Sinn … Unsere Sprache wird in hundert Jahren die europäische Sprache sein. Die Länder des Ostens, des Nordens wie des Westens werden, um sich mit uns verständigen zu können, unsere Sprache lernen. Die Voraussetzung dafür: An die Stelle der gotisch genannten Schrift tritt die Schrift, welche wir bisher die lateinische nannten […]“

          – Adolf Hitler[13]

          mfg Beat

          --
          ><o(((°>           ><o(((°>
             <°)))o><                     ><o(((°>o
          Der Valigator leibt diese Fische