Linuchs: Codierungsproblem einer URL

0 46

Codierungsproblem einer URL

Linuchs
  • html
  1. 0
    Der Martin
    1. 0

      danke

      Linuchs
      1. 0
        Gunnar Bittersmann
        1. 0

          Passender Zeichenvorrat erspart das Encoding

          Robert R.
          1. 0
            hotti
          2. 0
            Der Martin
            1. 0
              Gunnar Bittersmann
              1. 0
                Robert R.
                1. 0
                  Gunnar Bittersmann
                  1. 0
                    Robert R.
                    1. 0
                      Gunnar Bittersmann
                      1. 0
                        Robert R.
                        1. 0
                          Gunnar Bittersmann
                          1. 0
                            Camping_RIDER
                            1. 0
                              Gunnar Bittersmann
                              1. 0
                                Camping_RIDER
                      2. 0
                        Camping_RIDER
                        1. 0
                          Camping_RIDER
                          1. 0
                            Gunnar Bittersmann
                            1. 0
                              Camping_RIDER
                              1. 0
                                Robert R.
                                1. 0
                                  Camping_RIDER
                        2. 0
                          Gunnar Bittersmann
                          1. 0
                            Camping_RIDER
                            1. 0
                              Gunnar Bittersmann
                              1. 0
                                Camping_RIDER
                                1. 0
                                  Gunnar Bittersmann
                                  1. 0
                                    Der Martin
                              2. 0
                                Robert R.
                                1. 0
                                  Gunnar Bittersmann
                                  1. 0
                                    Camping_RIDER
                                    1. 0
                                      dedlfix
                                      1. 0
                                        Robert R.
                                    2. 0
                                      Gunnar Bittersmann
                                      1. 0
                                        Auge
                                    3. 0

                                      (Un-)Kultur von Webseiten

                                      Gunnar Bittersmann
                                      • sonstiges
                                      1. 0
                                        Camping_RIDER
                      3. 0
                        Gunnar Bittersmann
                        1. 0
                          dedlfix
                2. 0
                  dedlfix
          3. 0
            dedlfix
          4. 0
            Robert R.
    2. 0
      Gunnar Bittersmann
      1. 0
        Camping_RIDER
  2. 1
    dedlfix

Hallo,

irgendwie bekomme ich das folgende Problem nicht gelöst. Eine URL enthält das Zeichen ' - bei meiner Tastatur auf der Taste #. Ich habe den Code gesucht, es gibt aber einige gleich aussehende Zeichen und den Begriff "Hochkomma" konnte ich nicht finden.

http://shantychor-bad-zwischenahn.de/Unsere CD's/10-an-de-eck.mp3

Das hole ich aus der Datenbank (UTF-8 codiert) und gebe es so in eine HTML-Seite:

echo "<a id='No".$lfd."' href='".$row['url']."'>&nbsp;</a>";

Im Quellcode zeigt der Firefox an:
<a id='No29' href='http://shantychor-bad-zwischenahn.de/Unsere%20CD's/10-an-de-eck.mp3'>&nbsp;</a>

der hat also schon mal das Leerzeichen interpretiert. Aber klar, dass der Link nach den Buchstaben CD aufhört. Nun könnte man meinen, dieses hier schafft Abhilfe:

echo "<a id='No".$lfd."' href='".urlencode($row['url'])."'>&nbsp;</a>";

Jetzt zeigt der Firefox-Quellcode dieses:

<a id='No29' href='http%3A%2F%2Fshantychor-bad-zwischenahn.de%2FUnsere%2520CD%27s%2F10-an-de-eck.mp3'>&nbsp;</a>

das Leerzeichen wurde also zu %2520 - das funktioniert auch nicht.

Gut, nun könnte ich die umschließenden Quotes auf " ändern. Aber in URLs scheinen alle Zeichen vorkommen zu dürfen, ich verschiebe das Problem dann nur auf irgendwann.

Gruß Linuchs

  1. Hi,

    irgendwie bekomme ich das folgende Problem nicht gelöst. Eine URL enthält das Zeichen ' - bei meiner Tastatur auf der Taste #.

    also ein "single quote" oder auch Apostroph U+0027.[*]

    http://shantychor-bad-zwischenahn.de/Unsere CD's/10-an-de-eck.mp3

    Pfui! Wer trennt denn da das Plural-s mit einem Apostroph ab?

    Das hole ich aus der Datenbank (UTF-8 codiert) und gebe es so in eine HTML-Seite:

    echo "<a id='No".$lfd."' href='".$row['url']."'>&nbsp;</a>";

    Klarer Fall: Kontextwechsel nicht beachtet. Zur Ausgabe in den HTML-Kontext wäre htmlspecialchars() anzuwenden.

    Im Quellcode zeigt der Firefox an:
    <a id='No29' href='http://shantychor-bad-zwischenahn.de/Unsere%20CD's/10-an-de-eck.mp3'>&nbsp;</a>

    der hat also schon mal das Leerzeichen interpretiert. Aber klar, dass der Link nach den Buchstaben CD aufhört. Nun könnte man meinen, dieses hier schafft Abhilfe:

    echo "<a id='No".$lfd."' href='".urlencode($row['url'])."'>&nbsp;</a>";

    Nein, Unfug.

    So long,
     Martin

    [*] Ja, Gunnar ich weiß ... aber deinen Einwand lehne ich schon präventiv ab. ;-)

    --
    F: Wer ist der Herrscher über Wasser, Wind und Wellen?
    A: Der Friseur.
    Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
    1. Hi,

      die URL-Gerechte Codierung des Zeichens %27 hat mir gefehlt.

      Das hole ich aus der Datenbank (UTF-8 codiert) und gebe es so in eine HTML-Seite:

      Sorry, in der Datenbank war das Leerzeichen (per Eingabeprogramm) als %20 drin, habe ich mit phpmyadmin wieder auf Leerzeichen gesetzt.

      echo "<a id='No".$lfd."' href='".$row['url']."'>&nbsp;</a>";

      Klarer Fall: Kontextwechsel nicht beachtet. Zur Ausgabe in den HTML-Kontext wäre htmlspecialchars() anzuwenden.

      Hatte ich schon probiert und auf dein Anraten nochmal. Der Firefox-Quelltext zeigt mit oder ohne htmlspecialchars() das Zeichen ' an. Ist nun die Anzeige manipuliert?

      Das müsste doch per urlencode zu %27 werden? Test:

      echo "<a id='No".$lfd."' href='".str_replace("'","%27",$row['url'])."'>&nbsp;</a>";

      Jetzt geht es.

      Aber ich darf nur dieses eine Zeichen codieren, wenn ich auch http:// durch urlencode umsetzen lasse, funktioniert es nicht.

      Linuchs

      1. @@Linuchs:

        nuqneH

        Sorry, in der Datenbank war das Leerzeichen (per Eingabeprogramm) als %20 drin, habe ich mit phpmyadmin wieder auf Leerzeichen gesetzt.

        Ja, das waren kaputte Daten. In der DB sollte "http://shantychor-bad-zwischenahn.de/Unsere CD's/10-an-de-eck.mp3" stehen (oder "http://shantychor-bad-zwischenahn.de/Unsere%20CD%27s/10-an-de-eck.mp3"), aber nicht %20 und ' gemischt.

        Klarer Fall: Kontextwechsel nicht beachtet. Zur Ausgabe in den HTML-Kontext wäre htmlspecialchars() anzuwenden.

        Hatte ich schon probiert und auf dein Anraten nochmal.

        Und am Ende doch nicht gemacht? Du musst ALLES, was in HTML ausgegeben werden, absichern. Kannst du sicher sein, dass die URIs in der DB keine Angriffe enthalten? Und sie das auch in aller Zukunft nicht werden? Vermutlich nicht. Also htmlspecialchars() anwenden!!!

        (Der kranke Geist ist hier nicht auf Seiten dessen, der multiple Ausrufezeichen setzt, sonden auf dessen, der Sicherheitslöcher aufreißt.)

        Der Firefox-Quelltext zeigt mit oder ohne htmlspecialchars() das Zeichen ' an. Ist nun die Anzeige manipuliert?

        htmlspecialchars() wirkt per Default nicht auf '.

        Aber ich darf nur dieses eine Zeichen codieren, wenn ich auch http:// durch urlencode umsetzen lasse, funktioniert es nicht.

        Auf der sicheren Seite bist du, wenn du nicht speziell ' behandelst, sondern alle derartigen Zeichen im Pfad. URI am ersten / nach dem Hostnamen (Domain) auftrennen, Schwanz behandeln, URI wieder zusammensetzen.

        Qapla'

        --
        „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
        1. Liebe Mitdenker,
          liebe Wissende,
          liebe Neugierige,

          ja!

          Auf der sicheren Seite bist du, wenn du nicht speziell ' behandelst, sondern alle derartigen Zeichen im Pfad. URI am ersten / nach dem Hostnamen (Domain) auftrennen, Schwanz behandeln, URI wieder zusammensetzen.

          @Linuchs:

          Wenn man PHP benutzt, bietet sich die Funktion

          parse_url() http://php.net/manual/en/function.parse-url.php dafür an, um sich damit eine schlaue "encode_request_string()" zu basteln. Wenn die einmal funktioniert, muss man nie wieder darüber nachdenken ;-))

          Vielleicht habe ich nachher ja noch Lust dazu, das mal zu basteln.

          Prinzipiell gilt die ungeschriebene Regel: Keine Zeichen oberhalb #127 verwenden und von denen auch nur eine beschränkte Auswahl. Probleme machen nämlich nicht nur HTML und HTTP, sondern auch das Filesystem des Zielservers und ggf. das des Request-Hosts, sowie das DNS.

          Spirituelle Grüße
          Euer Robert

          --
          Möge der Forumsgeist wiederbelebt werden!
          1. Liebe Mitdenker,

            Prinzipiell gilt die ungeschriebene Regel: Keine Zeichen oberhalb #127 verwenden und von denen auch nur eine beschränkte Auswahl. Probleme machen nämlich nicht nur HTML und HTTP, sondern auch das Filesystem des Zielservers und ggf. das des Request-Hosts, sowie das DNS.

            Beachte bitte: Für den Enctype="application/x-www-form-urlencoded" werden NICHT die Zeichen kodiert (Percent-Encoding) sondern die zum jeweiligen Zeichen gehörigen Bytes.

            MfG

          2. Hallo,

            Prinzipiell gilt die ungeschriebene Regel: Keine Zeichen oberhalb #127 verwenden und von denen auch nur eine beschränkte Auswahl.

            du redest noch von URLs und Dateinamen? Dann stimme ich zu.

            Während URLs zwar mit dem Percent-Encoding eine Möglichkeit vorsehen, Zeichen außerhalb dieses Bereichs "sicher" zu übermitteln, scheitert das eventuell an etwas anderem, nämlich an der Zeichencodierung, die dann nicht eindeutig ist.

            In Dateinamen sind zwar in manchen Dateisystemen Zeichen außerhalb des ASCII-Bereichs erlaubt, eventuell sogar das ganze Unicode-Spektrum. Aber auch hier gilt: Anwendungen "wissen" nicht unbedingt, in welcher Zeichencodierung das File-API des Betriebssystems die Dateinamen erwartet. In Windows ist das entweder eine landestypische 1-Byte-Codierung (hierzulande meist Windows-1252), wenn man die alten Funktionen verwendet, oder UCS2 (eine Untermenge von UTF-16) bei Verwendung der modernen Funktionen; in Linux ist es häufig UTF-8 (wobei der Linux-Kernel selbst sich nicht um die Zeichencodierung schert). Ich hatte da letztes Jahr eine lange Diskussion vor allem mit Tom, der das Zusammenspiel von PHP unter Windows und anderen Anwendungen aufdröseln wollte, damit aber letztendlich gescheitert ist.

            Probleme machen nämlich nicht nur HTML und HTTP, sondern auch das Filesystem des Zielservers und ggf. das des Request-Hosts, sowie das DNS.

            Das DNS eigentlich nicht, denn in Hostnamen ist nur eine sehr eingeschränkte Untermenge von ASCII erlaubt. Domainnamen, die scheinbar diesen Rahmen sprengen, werden hinter den Kulissen durch Punycode auf den erlaubten Zeichensatz abgebildet, so dass im DNS meines Wissens nur [a-z0-9.-] auftreten - und der Punkt sogar mit der Sonderbedeutung, Namensteile voneinander zu trennen, so dass er nicht innerhalb eines Namensteils verwendet werden kann.

            So long,
             Martin

            --
            Ich bin 30. Ich demensiere apokalyptisch.
              (Orlando)
            Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
            1. @@Der Martin:

              nuqneH

              Prinzipiell gilt die ungeschriebene Regel: Keine Zeichen oberhalb #127 verwenden und von denen auch nur eine beschränkte Auswahl.

              du redest noch von URLs und Dateinamen? Dann stimme ich zu.

              Ihr beiden habt den Sinn der ersten beiden Ws in WWW nicht verstanden. Oder denkt ihr gar, die Bezeichnung WWW ist auf eine prellende W-Taste zurückzuführen?

              Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … Dateien/Ressourcen mit lateinischen Buchstaben benennen?

              Qapla'

              --
              „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
              1. Liebe Mitdenker,
                liebe Wissende,
                liebe Neugierige,

                ja!

                @@Der Martin:

                nuqneH

                Prinzipiell gilt die ungeschriebene Regel: Keine Zeichen oberhalb #127 verwenden und von denen auch nur eine beschränkte Auswahl.

                du redest noch von URLs und Dateinamen? Dann stimme ich zu.

                Ihr beiden habt den Sinn der ersten beiden Ws in WWW nicht verstanden. Oder denkt ihr gar, die Bezeichnung WWW ist auf eine prellende W-Taste zurückzuführen?

                Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … Dateien/Ressourcen mit lateinischen Buchstaben benennen?

                Weil er es kann?

                https://www.youtube.com/watch?v=vngSFSKntfc
                http://static.cosmiq.de/data/de/cd2/1b/cd21b65f538aa34b08971456f707243e_1_orig.jpg
                http://images.gutefrage.net/media/fragen-antworten/bilder/66586628/0_big.jpg
                usw.

                Spirituelle Grüße
                Euer Robert

                --
                Möge der Forumsgeist wiederbelebt werden!
                1. @@Robert R.:

                  nuqneH

                  Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … Dateien/Ressourcen mit lateinischen Buchstaben benennen?

                  Weil er es kann?

                  Nein.

                  Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … lateinische Buchstaben können müssen?

                  Qapla'

                  --
                  „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                  1. Liebe Mitdenker,
                    liebe Wissende,
                    liebe Neugierige,

                    ja!

                    @@Robert R.:

                    nuqneH

                    Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … Dateien/Ressourcen mit lateinischen Buchstaben benennen?

                    Weil er es kann?

                    Nein.

                    Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … lateinische Buchstaben können müssen?

                    Weil er damit einen Computer so bedienen kann, wie ein Ami, Westeuropäer, Inselaffe, Australier oder sonstiger Mitbürger der Kontinente, von denen der Computer in diese Welt implementiert wurde?

                    Spirituelle Grüße
                    Euer Robert

                    --
                    Möge der Forumsgeist wiederbelebt werden!
                    1. @@Robert R.:

                      nuqneH

                      Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … lateinische Buchstaben können müssen?

                      Weil er damit einen Computer so bedienen kann, wie ein Ami, Westeuropäer, Inselaffe, Australier oder sonstiger Mitbürger der Kontinente, von denen der Computer in diese Welt implementiert wurde?

                      Das Abendland als Maß aller Dinge? Von da ist es nicht mehr weit zum Rassismus.

                      Nimm Chinesisch und Japanisch, die tatsächlich üblicherweise mittles lateinischer Umschrift eingegeben werden, aus der Liste raus. Verbleiben immer noch unzählige andere Schriften.

                      Qapla'

                      --
                      „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                      1. Liebe Mitdenker,
                        liebe Wissende,
                        liebe Neugierige,

                        ja!

                        @@Robert R.:

                        nuqneH

                        Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … lateinische Buchstaben können müssen?

                        Weil er damit einen Computer so bedienen kann, wie ein Ami, Westeuropäer, Inselaffe, Australier oder sonstiger Mitbürger der Kontinente, von denen der Computer in diese Welt implementiert wurde?

                        Das Abendland als Maß aller Dinge? Von da ist es nicht mehr weit zum Rassismus.

                        Nimm Chinesisch und Japanisch, die tatsächlich üblicherweise mittles lateinischer Umschrift eingegeben werden, aus der Liste raus. Verbleiben immer noch unzählige andere Schriften.

                        Sumerisch, Hethitisch, ...
                        Da gibt es heute noch Schriften, die man noch nicht entschlüsseln konnte. Da sieht man mal, was dabei herauskommt, wenn jeder seine eigene Schrift benutzt. Etwas weniger Entropie wäre also im Sinne aller Völker.

                        Spirituelle Grüße
                        Euer Robert

                        --
                        Möge der Forumsgeist wiederbelebt werden!
                        1. @@Robert R.:

                          nuqneH

                          Da sieht man mal, was dabei herauskommt, wenn jeder seine eigene Schrift benutzt. Etwas weniger Entropie wäre also im Sinne aller Völker.

                          Da sieht man mal, was dabei herauskommt, wenn jeder an seinen eigenen Gott glaubt oder auch an gar keinen. Auch da weniger Entropie?

                          Bei Hautfarben auch weniger Entropie? Bei Augenfarben?

                          Qapla'

                          --
                          „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                          1. Aloha ;)

                            Da sieht man mal, was dabei herauskommt, wenn jeder seine eigene Schrift benutzt. Etwas weniger Entropie wäre also im Sinne aller Völker.

                            Da sieht man mal, was dabei herauskommt, wenn jeder an seinen eigenen Gott glaubt oder auch an gar keinen. Auch da weniger Entropie?

                            Bei Hautfarben auch weniger Entropie? Bei Augenfarben?

                            Merke: es besteht ein grundsätzlicher Unterschied zwischen der Förderung internationaler Verständigung und kultureller sowie schönheitsidealistischer und anderweitiger Gleichmacherei.

                            Du willst doch nur nicht zugeben, dass du übertrieben hast ;)

                            Grüße,

                            RIDER

                            --
                            Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                            ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                            1. @@Camping_RIDER:

                              nuqneH

                              Merke: es besteht ein grundsätzlicher Unterschied zwischen der Förderung internationaler Verständigung und kultureller sowie schönheitsidealistischer und anderweitiger Gleichmacherei.

                              Es geht nicht um internationale Verständigung. Dass das Web weltweit ist, heißt nicht, dass jede Information für jeden lesbar sein muss. Auch nicht jeder URI.

                              Um an die Information zu kommen, dass im Nachbardorf ein Sack Reis umgefallen ist, sollte niemand zwingend lateinische Buchstaben können müssen.

                              Qapla'

                              --
                              „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                              1. Aloha ;)

                                Merke: es besteht ein grundsätzlicher Unterschied zwischen der Förderung internationaler Verständigung und kultureller sowie schönheitsidealistischer und anderweitiger Gleichmacherei.

                                Es geht nicht um internationale Verständigung. Dass das Web weltweit ist, heißt nicht, dass jede Information für jeden lesbar sein muss. Auch nicht jeder URI.

                                Moment, darum gings in diesem Diskussionsstrang gar nicht :P Hier stand nir Roberts Aussage im Raum, dass es vorteilhaft und geschichtlich mit vielen Beispielen versehen ist, wenn unterschiedliche Zeichensätze (lies: Schriften) wegfallen. Also ging es (hier) sehr wohl um internationale Verständigung :P

                                Um an die Information zu kommen, dass im Nachbardorf ein Sack Reis umgefallen ist, sollte niemand zwingend lateinische Buchstaben können müssen.

                                Muss man ja auch nicht. Das berichten mir Lokalzeitung oder Lokalfernsehen :P Dafür muss ich nicht auf ein Medium mit internationaler Reichweite ausweichen.

                                Aber lass uns das an anderer Stelle ausdiskutieren :P

                                Die Paralleldiskussion in drei Strängen um ein und dasselbe Thema führt zu nichts :D

                                Grüße,

                                RIDER

                                --
                                Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                                ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                      2. Aloha ;)

                        Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … lateinische Buchstaben können müssen?

                        Weil er damit einen Computer so bedienen kann, wie ein Ami, Westeuropäer, Inselaffe, Australier oder sonstiger Mitbürger der Kontinente, von denen der Computer in diese Welt implementiert wurde?

                        Das Abendland als Maß aller Dinge? Von da ist es nicht mehr weit zum Rassismus.

                        Nu, jetzt malst du den Teufel aber ganz groß an die Wand. Der Schritt zwischen Roberts Aussage und deiner Folgerung ist tatsächlich weit.

                        Einer gewissen Standardisierung (und sei es fixiert auf das, was im Abendland üblich ist) zu folgen, ist ja nicht per se schlecht. Englisch ist "Weltsprache", Sprache der Wissenschaft und damit auch Sprache des Web (wenn man bedenkt, dass das WWW im Rahmen der Wissenschaft als Hilfsmittel im CERN entstanden ist).

                        Dass in Italien arabische Ziffern statt römischer Ziffern üblich ist, ist auch kein Grund davon zu sprechen, dass die Araber die italienische Kultur bedrohen...

                        Also bitte auf dem Boden der Tatsachen bleiben...

                        Grüße,

                        RIDER

                        --
                        Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                        ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                        1. Aloha ;)

                          Einer gewissen Standardisierung (und sei es fixiert auf das, was im Abendland üblich ist) zu folgen, ist ja nicht per se schlecht. Englisch ist "Weltsprache", Sprache der Wissenschaft und damit auch Sprache des Web (wenn man bedenkt, dass das WWW im Rahmen der Wissenschaft als Hilfsmittel im CERN entstanden ist).

                          Ups, mir ging meine Pointe verloren. Eigentlich wollte ich hier sagen, dass es deshalb nur konsequent ist, dass grundsätzlichen Komponenten der Zeichensatz zugrunde liegt, der in der englischen Sprache relevant ist.

                          Grüße,

                          RIDER

                          --
                          Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                          ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                          1. @@Camping_RIDER:

                            nuqneH

                            Einer gewissen Standardisierung (und sei es fixiert auf das, was im Abendland üblich ist) zu folgen, ist ja nicht per se schlecht. Englisch ist "Weltsprache", Sprache der Wissenschaft und damit auch Sprache des Web (wenn man bedenkt, dass das WWW im Rahmen der Wissenschaft als Hilfsmittel im CERN entstanden ist).

                            Ups, mir ging meine Pointe verloren. Eigentlich wollte ich hier sagen, dass es deshalb nur konsequent ist, dass grundsätzlichen Komponenten der Zeichensatz zugrunde liegt, der in der englischen Sprache relevant ist.

                            Wo ist die Pointe? Dass, sobald du einen Schritt aus dem CERN rausmachst, ringsum französisch gesprochen wird?

                            Qapla'

                            --
                            „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                            1. Aloha ;)

                              Einer gewissen Standardisierung (und sei es fixiert auf das, was im Abendland üblich ist) zu folgen, ist ja nicht per se schlecht. Englisch ist "Weltsprache", Sprache der Wissenschaft und damit auch Sprache des Web (wenn man bedenkt, dass das WWW im Rahmen der Wissenschaft als Hilfsmittel im CERN entstanden ist).

                              Ups, mir ging meine Pointe verloren. Eigentlich wollte ich hier sagen, dass es deshalb nur konsequent ist, dass grundsätzlichen Komponenten der Zeichensatz zugrunde liegt, der in der englischen Sprache relevant ist.

                              Wo ist die Pointe? Dass, sobald du einen Schritt aus dem CERN rausmachst, ringsum französisch gesprochen wird?

                              Okay, ich buchstabier's dir ;) Das Internet ist ursprünglich ein Hilfsmittel für die Wissenschaft, das an einer wissenschaftlichen Einrichtung entwickelt wurde. Englisch ist die Sprache der Wissenschaft und da das Web ursprünglich eine wissenschaftliche Anwendung war und englischsprachig betrieben wurde, ist es auch legitim, die englische Sprache als seine Muttersprache anzusehen.

                              Dass das Cern geographisch ganz in der Nähe des Geburtsorts von französischen, italienischen und deutschen Muttersprachlern steht ist genauso irelevant, wie wenn in China ein Sack Reis umfällt, auf dem in lateinischen Lettern in Englischer Sprache ein französischstämmiges Wort vermerkt ist, auf das drei arabische Zahlen und fünf chinesische Zeichen folgen.

                              Grüße,

                              RIDER

                              --
                              Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                              ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                              1. Liebe Mitdenker,
                                liebe Wissende,
                                liebe Neugierige,

                                ja!

                                Okay, ich buchstabier's dir ;) Das Internet ist ursprünglich ein Hilfsmittel für die Wissenschaft, das an einer wissenschaftlichen Einrichtung entwickelt wurde. Englisch ist die Sprache der Wissenschaft und da das Web ursprünglich eine wissenschaftliche Anwendung war und englischsprachig betrieben wurde, ist es auch legitim, die englische Sprache als seine Muttersprache anzusehen.

                                ⸮Und um ein Haar wäre Deutsch die Weltsprache geworden. Stop! Nicht erst beim Kaiser oder unter Adolf, sondern schon ca. 200 Jahre früher, als in die Abstimmung in den USA stattgefunden hat, welche Amtssprache man wolle⸮

                                Richtig™stellung: http://www.spiegel.de/kultur/zwiebelfisch/zwiebelfisch-deutsch-als-amtssprache-der-usa-a-295157.html

                                Spirituelle Grüße
                                Euer Robert

                                --
                                Möge der Forumsgeist wiederbelebt werden!
                                1. Aloha ;)

                                  Okay, ich buchstabier's dir ;) Das Internet ist ursprünglich ein Hilfsmittel für die Wissenschaft, das an einer wissenschaftlichen Einrichtung entwickelt wurde. Englisch ist die Sprache der Wissenschaft und da das Web ursprünglich eine wissenschaftliche Anwendung war und englischsprachig betrieben wurde, ist es auch legitim, die englische Sprache als seine Muttersprache anzusehen.

                                  ⸮Und um ein Haar wäre Deutsch die Weltsprache geworden. Stop! Nicht erst beim Kaiser oder unter Adolf, sondern schon ca. 200 Jahre früher, als in die Abstimmung in den USA stattgefunden hat, welche Amtssprache man wolle⸮

                                  Nicht nur das! Wäre Adolf eben NICHT gewesen, wäre Deutsch heute unter Umständen vielleicht trotzdem Weltsprache geworden. Bis zum zweiten Weltkrieg war Deutsch eine Sprache der Wissenschaft, gleichauf mit Englisch. Erst Nazidiktatur, der zweite Weltkrieg und seine Folgen haben Deutsch als Wissenschaftssprache unbedeutend werden lassen - da es kaum mehr, oder zumindest deutlich weniger, Wissenschaftler im deutschsprachigen Raum gab. Wäre das nicht gewesen sähe heute einiges anders aus (okay, sowieso, ich meinte jetzt aber sprachlich)...

                                  Z.B. nachzulesen in der Wikipedia...

                                  Grüße,

                                  RIDER

                                  --
                                  Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                                  ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                        2. @@Camping_RIDER:

                          nuqneH

                          Das Abendland als Maß aller Dinge? Von da ist es nicht mehr weit zum Rassismus.

                          Nu, jetzt malst du den Teufel aber ganz groß an die Wand. Der Schritt zwischen Roberts Aussage und deiner Folgerung ist tatsächlich weit.

                          Ist er?

                          Zu fordern, dass jemand zur Nutzung des WWW (oder des Computers allgemeint) das lateinische Alphabet beherrschen muss, heißt allen, die lateinische Buchstaben nicht kennen, den Zugang zum WWW (zu Computern) zu verwehren.

                          „Ein erweiterter Rassismusbegriff kann auch eine Vielzahl anderer Kategorien miteinbeziehen. Menschen mit rassistischen Vorurteilen diskriminieren andere aufgrund solcher Zugehörigkeit, institutioneller Rassismus verweigert bestimmten Gruppen Vorteile und Leistungen oder privilegiert andere.“ [Wikipedia]

                          Englisch ist "Weltsprache", Sprache der Wissenschaft und damit auch Sprache des Web

                          Dass das Web auf Wissenschaft beschränkt ist, ist mindestens 20 Jahre her. Das Web ist heute für jeden. Und zwar uabhängig von ihrer Muttersprache.


                          Credits: Nick Webb (CC BY 2.0)

                          Qapla'

                          --
                          „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                          1. Aloha ;)

                            Ich gebe dir grundsätzlich recht. Allerdings ist schon die These, das Internet sei für jeden, zwar schön schlagfertig, aber ganzheitlich betrachtet nicht tatsachengerecht.

                            Es gibt kein Grumdrecht auf Zugang zum Internet. Schon gar nicht international. Es gibt keine geographisch umfassende oder ausreichende Versorgungsmöglichkeit. Da PCs 0der andere internetfähige Geräte, geschweige denn Strom, nicht überall vorhanden oder verfügbar sind, ist das auch zunächst gar nicht zu erreichen.

                            Menschen in China oder Nordkorea wissen, dass das Internet nach Willen ihrer Regierung nur in Teilen "für sie ist".

                            Wer heutzutage studieren möchte, kommt um das Erlernen der englischen Sprache nicht drumrum. Wer ins Internet möchte, kann das (imho) nicht unbedingt erwarten, wenn er keine URL in lateinischen Buchstaben tippen kann. Bedenke: Wir sind noch weit davon entfernt, dass die betreffende Barriere oberhalb der Möglichkeiten des Einzelnen, das benötigte einfach zu erlernen, liegt. Erst dann haben wir ein tatsächliches Problem der Barrierefreiheit.

                            Bevor wir also die Notwendigkeit einer lokal abhängigen Zeichenkodierung für Domains durch den Slogan 'The web is for everyone' begründen, sollte das erstmal geographisch und Kultur-/Nationalität- unabhängig gelten. Was es nicht tut.

                            Grüße,

                            RIDER

                            --
                            Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                            ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                            1. @@Camping_RIDER:

                              nuqneH

                              Es gibt kein Grumdrecht auf Zugang zum Internet. Schon gar nicht international. Es gibt keine geographisch umfassende oder ausreichende Versorgungsmöglichkeit. Da PCs 0der andere internetfähige Geräte, geschweige denn Strom, nicht überall vorhanden oder verfügbar sind, ist das auch zunächst gar nicht zu erreichen.

                              Dass es für viele Menschen ohnehin schon Barrieren gibt, ins Web zu kommen, nimmst du als Rechtfertigung, noch eine weitere Barriere – die sprachliche – aufzubauen?

                              Wer heutzutage studieren möchte, kommt um das Erlernen der englischen Sprache nicht drumrum.

                              Schon wieder „studieren“, Wissenschaft. Nochmal: Das Web ist für alle.

                              Wer ins Internet möchte, kann das (imho) nicht unbedingt erwarten, wenn er keine URL in lateinischen Buchstaben tippen kann.

                              Doch, genau das sollte er erwarten können. Genau dafür gibt es IRIs. (IRIs sind das, was man als Webadresse eintippt, nicht URLs.)

                              Qapla'

                              PS: Technisch gesehen bestehen URLs/URIs nur aus

                              --
                              „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                              1. Aloha ;)

                                Es gibt kein Grumdrecht auf Zugang zum Internet. Schon gar nicht international. Es gibt keine geographisch umfassende oder ausreichende Versorgungsmöglichkeit. Da PCs 0der andere internetfähige Geräte, geschweige denn Strom, nicht überall vorhanden oder verfügbar sind, ist das auch zunächst gar nicht zu erreichen.

                                Dass es für viele Menschen ohnehin schon Barrieren gibt, ins Web zu kommen, nimmst du als Rechtfertigung, noch eine weitere Barriere – die sprachliche – aufzubauen?

                                Nein, sondern als Argument, dass wir ohnehin noch weit vom Idealzustand entfernt sind.

                                Wer heutzutage studieren möchte, kommt um das Erlernen der englischen Sprache nicht drumrum.

                                Schon wieder „studieren“, Wissenschaft. Nochmal: Das Web ist für alle.

                                Ja. Und wie sieht es aus mit Berufen in der Wirtschaft? Die benötigen die englische Sprache genauso. Das war nur als Beispiel zu sehen. Wer Autofahren möchte, muss das zunächst erlernen. Ist aber prinzipiell nebensächlich.

                                Wer ins Internet möchte, kann das (imho) nicht unbedingt erwarten, wenn er keine URL in lateinischen Buchstaben tippen kann.

                                Doch, genau das sollte er erwarten können. Genau dafür gibt es IRIs. (IRIs sind das, was man als Webadresse eintippt, nicht URLs.)

                                Und das ist auch gut so.

                                Ich glaube du hast Robert und mich (zumindest mich) grundsätzlich falsch verstanden.

                                Mein Plädoyer gilt keinesfalls dem, dass der Zugriff nicht für jeden in seiner Muttersprache verfügbar sein SOLLTE.

                                Genauso bin ich der Meinung, dass auch das Web für jeden sein SOLLTE.

                                Nur empfinde ich das potentiell nötige Erlernen lateinischer Buchstaben nicht als so gravierende Barriere, dass man deshalb gleich am Rassismusvergleich zerren sollte.

                                Vor allem nicht vor dem Licht der Barrieren, die sonst noch so existieren.

                                Und tatsächlich sind IRIs - zumindest so wie ich es verstanden habe - auch nur Umsetzungen, die intern wieder in die Muttersprache (lies: Mutter-Schrift) des Internet umgesetzt werden (oder werden können). Also mehr ein Mittel der Transkription als ein tatsächliches Nutzen einer anderen Schrift.

                                Nochmal: Die Sache selbst wollte ich nie in Zweifel ziehen (sonst hättest du vollkommen recht, damm wären meine Argumente Schwachsinn), sondern lediglich den schnellen Schuss in Richtung Rassismus relativieren.

                                Tut mir leid, wenn ich dieses Missverständnis verursacht habe. Meine eigentliche Bitte war ja bloß, auf dem Boden der Tatsachen zu bleiben.

                                Grüße,

                                RIDER

                                --
                                Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                                ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                                1. @@Camping_RIDER:

                                  nuqneH

                                  Dass es für viele Menschen ohnehin schon Barrieren gibt, ins Web zu kommen, nimmst du als Rechtfertigung, noch eine weitere Barriere – die sprachliche – aufzubauen?

                                  Nein, sondern als Argument, dass wir ohnehin noch weit vom Idealzustand entfernt sind.

                                  Sind wir. Wir sollten Barrieren abbauen, nicht weitere aufbauen.

                                  Ja. Und wie sieht es aus mit Berufen in der Wirtschaft? Die benötigen die englische Sprache genauso.

                                  Ich glaube, dass man in China sehr gut zurande kommt, ohne ein Wort Englisch zu können. In Lateinamerika vermutlich auch.

                                  Und willst du die Anwendung des Webs immer noch auf Wissenschaft und Beruf reduzieren?

                                  Wer Autofahren möchte, muss das zunächst erlernen. Ist aber prinzipiell nebensächlich.

                                  Wer Zeitung lesen möchte, muss das Lesen erlernen. Und zwar die für seine Sprache verwendete Schrift.

                                  Und wer Webseiten lesen möchte, muss das Lesen erlernen. Und zwar die für seine Sprache verwendete Schrift, und nicht noch eine andere fremde.

                                  Und tatsächlich sind IRIs - zumindest so wie ich es verstanden habe - auch nur Umsetzungen, die intern wieder in die Muttersprache (lies: Mutter-Schrift) des Internet umgesetzt werden (oder werden können).

                                  Ja. Ich hatte mein PS nicht vollendet. URLs/URIs bestehen aus ASCII-Zeichen. Wie IRIs in URIs umgesetzt werden (Host mit Punycode, Pfad prozentcodiert), geht den Nutzer nichts an. Dass man technisch zwischen URI und IRI unterscheidet, auch nicht. Deshalb hatte ich dein „URL“ gleich mal als „IRI“ gelesen.

                                  Qapla'

                                  --
                                  „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                                  1. Hallo,

                                    Ja. Ich hatte mein PS nicht vollendet. URLs/URIs bestehen aus ASCII-Zeichen.

                                    aha, jetzt sind wir wieder genau bei der Aussage, die ich heute mittag so ähnlich schon gemacht habe, und gerade auch mit Punycode und Percent Encoding als Beispiel. Und da hast du sie ins Lächerliche gezogen.

                                    Wie IRIs in URIs umgesetzt werden (Host mit Punycode, Pfad prozentcodiert), geht den Nutzer nichts an. Dass man technisch zwischen URI und IRI unterscheidet, auch nicht.

                                    Kommt drauf an, wie eng der Nutzer mit der Technik befreundet ist. Manche wollen vielleicht lieber mit "rohen" URLs umgehen.

                                    Ciao,
                                     Martin

                                    --
                                    Nicht jeder, der aus dem Rahmen fällt, war vorher im Bilde.
                                    Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
                              2. Liebe Mitdenker,
                                liebe Wissende,
                                liebe Neugierige,

                                ja!

                                Dass es für viele Menschen ohnehin schon Barrieren gibt, ins Web zu kommen, nimmst du als Rechtfertigung, noch eine weitere Barriere – die sprachliche – aufzubauen?

                                Du erwartest jetzt also von Sir Tim, der mit und für seine Freunde das WWW erfunden hat, dass er chinesische Schriftzeichen lernt, um 'sein' ganzes Netz durchstöbern zu können?

                                Übrigens gibt es in China ernstzunehmende Wissenschaftler, die sich mit der Umsetzung der chinesischen Sprache in lateinische Schrift beschäftigen. Betonungen lassen sich übrigens ganz einfach durch 'Haken und Ösen' (diakritische Zeichen) festlegen.

                                Spirituelle Grüße
                                Euer Robert

                                --
                                Möge der Forumsgeist wiederbelebt werden!
                                1. @@Robert R.:

                                  nuqneH

                                  Dass es für viele Menschen ohnehin schon Barrieren gibt, ins Web zu kommen, nimmst du als Rechtfertigung, noch eine weitere Barriere – die sprachliche – aufzubauen?

                                  Du erwartest jetzt also von Sir Tim, der mit und für seine Freunde das WWW erfunden hat, dass er chinesische Schriftzeichen lernt, um 'sein' ganzes Netz durchstöbern zu können?

                                  Nein, das eben gerade *nicht*. Aber genauso wenig erwarte ich von einem Chinesen, dass er lateinische Schriftzeichen lernt, um *seinen Teil* des Webs durchstöbern zu können.

                                  Es geht nicht darum, das ganze Web durchstöbern zu können. Es geht darum, dass man *seinen* Teil des Webs benutzen können sollte (und dazu gehört die Eingabe von IRIs), ohne eine *fremde* Schrift beherrschen zu müssen.

                                  Betonungen lassen sich übrigens ganz einfach durch 'Haken und Ösen' (diakritische Zeichen) festlegen.

                                  Oder durch Zahlen, ich weiß. Den 4 lateinischen Transkriptionen shī, shí, shǐ, shì (shi1, shi2, shi3, shi4) stehen immer noch 75 chinesische Schriftzeichen gegenüber.

                                  Qapla'

                                  --
                                  „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                                  1. Aloha ;)

                                    Aber jetzt mal ohne unnötig flapsig werden zu wollen... aber Chinesisch ist schon ein krasses Extrembeispiel. Ich meine... nicht mal alle Chinesen können Chinesisch... und Chinesisch ist nicht chinesisch sondern teilt sich wieder in vollkommen eigene, voneinander abgegrenzte  Sprachen (die wohl unterschiedlich genug sind, um sie meines Erachtens nach nicht Dialekte nennen zu können), die teils wieder nur von gewissen Bevölkerungsteilen verstanden und/oder verwendet werden...

                                    Ich fand den Wikipediaartikel ziemlich erhellend, ich hatte davor keine Ahnung über das tatsächliche Ausmaß oO

                                    Also ich bin ja kein Freund von Gleichmacherei... aber bezüglich Schrift und Sprache hätten die Chinesen mal dringend eine Optimierung nötig oO Auch wenn der Term 'Kulturoptimierung' an sich fragwürdig ist ;)

                                    Grüße,

                                    RIDER

                                    --
                                    Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                                    ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                                    1. Tach!

                                      Aber jetzt mal ohne unnötig flapsig werden zu wollen... aber Chinesisch ist schon ein krasses Extrembeispiel.

                                      Dafür trifft es ungefähr ein Fünftel der Weltbevölkerung.

                                      Übrigens, die "Haken und Ösen" sind auch kein Bestandteil von ASCII oder ISO-8859-1 (nicht alle jedenfalls). Schon insofern löst die Lateinisierung das Problem nicht, selbst wenn man mal annimmt, dass sie es prinzipiell könnte.

                                      Also ich bin ja kein Freund von Gleichmacherei... aber bezüglich Schrift und Sprache hätten die Chinesen mal dringend eine Optimierung nötig oO Auch wenn der Term 'Kulturoptimierung' an sich fragwürdig ist ;)

                                      Na viel Spaß dabei. Sie haben ja schon vor ein paar Jahrzehnten die Schrift vereinfacht, um mit weniger Strichen auszukommen. Aber nicht alle Chinesen haben das übernommen.

                                      dedlfix.

                                      1. Liebe Mitdenker,
                                        liebe Wissende,
                                        liebe Neugierige,

                                        ja!

                                        Na viel Spaß dabei. Sie haben ja schon vor ein paar Jahrzehnten die Schrift vereinfacht, um mit weniger Strichen auszukommen. Aber nicht alle Chinesen haben das übernommen.

                                        Das muss in der Zeit gewesen sein, als Olympia die Chinesische Schreibmaschine eingeführt hat.

                                        http://www.google.de/imgres?imgurl=http%3A%2F%2Fchiarc.com%2F2008%2Fimages%2Fgraphics%2Fbelegungsplan.png&imgrefurl=http%3A%2F%2Fchiarc.com%2F2008%2F%3FL%3DDE%26A%3D1011&h=900&w=1600&tbnid=7JHbu69-zTtUbM%3A&zoom=1&docid=fEtnv3BY3-W1SM&ei=G7-uVOniJ47qOIywgXA&tbm=isch&client=firefox-a&iact=rc&uact=3&dur=3506&page=1&start=0&ndsp=30&ved=0CCIQrQMwAA

                                        http://chiarc.com/2008/?L=DE&A=1011

                                        Spirituelle Grüße
                                        Euer Robert

                                        --
                                        Möge der Forumsgeist wiederbelebt werden!
                                    2. @@Camping_RIDER:

                                      nuqneH

                                      Chinesisch ist nicht chinesisch sondern teilt sich wieder in vollkommen eigene, voneinander abgegrenzte  Sprachen (die wohl unterschiedlich genug sind, um sie meines Erachtens nach nicht Dialekte nennen zu können), die teils wieder nur von gewissen Bevölkerungsteilen verstanden und/oder verwendet werden...

                                      Ja, (gesprochenes) Mandarin als Chinesisch zu bezeichnen, ist äußerst fragwürdig. Für die Schriftsprache sollte der Begriff Chinesisch aber so falsch nicht sein.

                                      Gleiches gilt BTW für Spanisch, das eigentlich Kastillisch genannt werden sollte.

                                      Also ich bin ja kein Freund von Gleichmacherei... aber bezüglich Schrift und Sprache hätten die Chinesen mal dringend eine Optimierung nötig oO Auch wenn der Term 'Kulturoptimierung' an sich fragwürdig ist ;)

                                      Kulturrevolution?

                                      Qapla'

                                      --
                                      „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                                      1. Hallo

                                        Also ich bin ja kein Freund von Gleichmacherei... aber bezüglich Schrift und Sprache hätten die Chinesen mal dringend eine Optimierung nötig oO Auch wenn der Term 'Kulturoptimierung' an sich fragwürdig ist ;)

                                        Kulturrevolution?

                                        Schon wieder? Die werden sich bedanken.

                                        Tschö, Auge

                                        --
                                        Verschiedene Glocken läuteten in der Stadt, und jede von ihnen vertrat eine ganz persönliche Meinung darüber, wann es Mitternacht war.
                                        Terry Pratchett, "Wachen! Wachen!"
                                        ie:{ fl:| br:> va:) ls:[ fo:) rl:( ss:| de:> js:| zu:}
                                        Veranstaltungsdatenbank Vdb 0.3
                                    3. @@Camping_RIDER:

                                      nuqneH

                                      Wikipediaartikel

                                      Ein misslungenes Beispiel für die (Un-)Kultur von Webseiten: Du verlinkst auf m dot, was für mich am Desktop völlig unpassend ist.

                                      Qapla'

                                      --
                                      „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                                      1. Aloha ;)

                                        Wikipediaartikel

                                        Ein misslungenes Beispiel für die (Un-)Kultur von Webseiten: Du verlinkst auf m dot, was für mich am Desktop völlig unpassend ist.

                                        Da sind wir zwei uns auch vollkommen einig, ja... eine m-dot-Seite möchte ich (wie ich ja schon klargestellt hatte) nur, wenn ich auch aktiv darum bitte... was ich bei wikipedia nicht getan hatte...

                                        Von daher: was das angeht full ack, mein Punkt damals war ja etwas anders gelagert...

                                        Grüße,

                                        RIDER

                                        --
                                        Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                                        ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
                      3. @@Gunnar Bittersmann:

                        nuqneH

                        Nimm Chinesisch und Japanisch, die tatsächlich üblicherweise mittles lateinischer Umschrift eingegeben werden, aus der Liste raus.

                        Wobei durchaus auch andere Eingaben als über lateinische Buchstaben denkbar sind, beispielsweise das Schreiben der CJK-Zeichen mit dem Finger auf einem Touchscreen.

                        Qapla'

                        --
                        „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
                        1. Tach!

                          Nimm Chinesisch und Japanisch, die tatsächlich üblicherweise mittles lateinischer Umschrift eingegeben werden, aus der Liste raus.
                          Wobei durchaus auch andere Eingaben als über lateinische Buchstaben denkbar sind, beispielsweise das Schreiben der CJK-Zeichen mit dem Finger auf einem Touchscreen.

                          Eingabemethoden für CJK-Zeichen gibt es gefühlt so viele wie chinesische Zeichen. Zeichen malen auf dem Touchscreen (Finger ist dafür Mist, Stift ist besser) ist nicht nur denkbar sondern eine existierende davon. Auch gibt es welche, die kommen mit den 10 Ziffern aus.

                          dedlfix.

                2. Tach!

                  Warum sollte ein Araber, Inder, Chinese, Japaner, Koreaner, … Dateien/Ressourcen mit lateinischen Buchstaben benennen?
                  Weil er es kann?

                  Chinesen können das nicht. Die haben nur sehr wenig Silben, aber zu jeder Silbe bis zu vier Aussprachen und eine Menge Zeichen mit unterschiedlichen Bedeutungen zugeordnet. Mit der lateinischen Umschrift geht der Sinn verloren, je kürzer der Text ist. Und dann käme es auch zu Dopplungen. Dein Video zeigt das für "shi" sehr schön. 75 Zeichen, die alle "shi" ausgesprochen und mit lateinischer Umschrift "shi" geschrieben werden. Lateinische Schrift eignet sich ziemlich schlecht für chinesische Dateiverwaltung.

                  dedlfix.

          3. Tach!

            Wenn man PHP benutzt, bietet sich die Funktion
            parse_url() http://php.net/manual/en/function.parse-url.php dafür an, um sich damit eine schlaue "encode_request_string()" zu basteln. Wenn die einmal funktioniert, muss man nie wieder darüber nachdenken ;-))

            Nein, das kann nicht funktionieren. Um eine URL korrekt parsen zu können, muss sie bereits korrekt zusammengebaut sein. Das gilt für alle Lebenslagen. Um etwas problemlos dekodieren zu können, muss es bereits den Regeln entsprechend kodiert worden sein. Sind da schon Fehler drin, fängt das Rätselraten an, was denn eigentlich gemeint sein könnte. Es gibt meist nur eine Art korrekter Kodierung, aber unzählig viele Arten, es falsch zu machen. Und nun schreib mal eine schlaue Funktion, die fehlerhaftes Zeug ohne Ausnahme richtig interpretieren kann.

            Sobald die URL zusammengesetzt wird, müssen deren Bestandteile regelgerecht eingefügt werden.

            dedlfix.

          4. Liebe Mitdenker,
            liebe Wissende,
            liebe Neugierige,

            ja!

            Wenn man PHP benutzt, bietet sich die Funktion

            parse_url() http://php.net/manual/en/function.parse-url.php dafür an, um sich damit eine schlaue "encode_request_string()" zu basteln. Wenn die einmal funktioniert, muss man nie wieder darüber nachdenken ;-))

            Da gibts übrigens schon 'was von PHP:
            http://php.net/manual/en/function.http-build-query.php
            wenn man schon mal den Query-String vom Host/Ressource-String abgetrennt hat.

            Spirituelle Grüße
            Euer Robert

            --
            Möge der Forumsgeist wiederbelebt werden!
    2. @@Der Martin:

      nuqneH

      also ein "single quote" oder auch Apostroph U+0027.[*]

      Benennen wir das Ding doch als das, was es ist: einfacher Stringbegrenzer (links/rechts).

      Dann merken die, die dieses Zeichen als Apostroph oder gar als Anführungszeichen einsetzen, dass da was nicht in Ordnung ist. ;-)

      Pfui! Wer trennt denn da das Plural-s mit einem Apostroph ab?

      Einer kriegt schon Haue.

      Qapla'

      --
      „Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)
      1. Aloha ;)

        also ein "single quote" oder auch Apostroph U+0027.[*]

        Benennen wir das Ding doch als das, was es ist: einfacher Stringbegrenzer (links/rechts).

        Dann merken die, die dieses Zeichen als Apostroph oder gar als Anführungszeichen einsetzen, dass da was nicht in Ordnung ist. ;-)

        Oder wissen's schon länger und zucken weiter aus Bequemlichkeit mit den Schultern :D

        Pfui! Wer trennt denn da das Plural-s mit einem Apostroph ab?

        Einer kriegt schon Haue.

        Immer auf die kleinen Dicken :D Wobei, Moment, klein bin ich ja gar nicht :D

        Grüße,

        RIDER

        --
        Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
        ch:? rl:| br:> n4:? ie:% mo:| va:) js:) de:> zu:) fl:( ss:| ls:[
  2. Tach!

    Aber klar, dass der Link nach den Buchstaben CD aufhört. Nun könnte man meinen, dieses hier schafft Abhilfe:

    echo "<a id='No".$lfd."' href='".urlencode($row['url'])."'>&nbsp;</a>";
    Jetzt zeigt der Firefox-Quellcode dieses:
    <a id='No29' href='http%3A%2F%2Fshantychor-bad-zwischenahn.de%2FUnsere%2520CD%27s%2F10-an-de-eck.mp3'>&nbsp;</a>
    das Leerzeichen wurde also zu %2520 - das funktioniert auch nicht.

    Ja, wenn das Leerzeichen zu %2520 wird, hast du ein als %20 kodiertes Leerzeichen nochmal kodiert, woraufhin es das % zu %25 kodiert hat. Außerdem ist urlencode() nicht dazu geeignet, eine vollständige URL zu bearbeiten. Es ist dafür vorgesehen, Daten zu kodieren, die in einem Teil einer URL weitergereicht werden sollen. Beispiele dazu im PHP-Handbuch. Zudem ist urlencode() nicht für den Path-Teil einer URL vorgesehen, dafür gibt es rawurlencode().

    dedlfix.