Connie: Sonderzeichen am Ende einer URL

Hallo,
Aus www.foo.com!  wird nach dem Absenden   www.foo.com!/
aus www.foo.com#  wird nach dem Absenden   www.foo.com/#

d.h. einmal steht das Sonderzeichen vor und einmal nach dem "/".
Warum ist dies so? Gibt es dafür eine Regel?
Gruß
Connie

  1. Hallo,

    Aus www.foo.com!  wird nach dem Absenden   www.foo.com!/

    ja, weil das '!' ein erlaubtes Zeichen in URLs ist.

    aus www.foo.com#  wird nach dem Absenden   www.foo.com/#

    Ja, weil das '#' die URL vom Anker abtrennt, der abschließende Slash kommt also vor dm '#'.

    d.h. einmal steht das Sonderzeichen vor und einmal nach dem "/".
    Warum ist dies so? Gibt es dafür eine Regel?

    Ja, siehe oben. :-)

    Ciao,
     Martin

    --
    Wichtig ist, was hinten rauskommt.
      (Helmut Kohl, 16 Jahre deutsche Bundesbirne)

    1. Hallo,
      danke erstmal,

      ja, weil das '!' ein erlaubtes Zeichen in URLs ist.

      Die Frage ist nun:
      - Welche Sonderzeichen sind erlaubt?
      - Welche nicht?
      - Welche haben eine Sonderfunktion wie #?

      Warum ist dies so? Gibt es dafür eine Regel?

      Ja, siehe oben. :-)

      Das sind nur Beispiele :-(

      Ciao,
      Martin

      1. Hi,

        ja, weil das '!' ein erlaubtes Zeichen in URLs ist.

        Die Frage ist nun:
        - Welche Sonderzeichen sind erlaubt?
        - Welche nicht?
        - Welche haben eine Sonderfunktion wie #?

        Die Frage ist nun:
        Was hast du unternommen, um naehere Informationen diesbezueglich zu finden?

        MfG ChrisB

        --
        "The Internet: Technological marvel of marvels - but if you don't know *what* you're lookin' for on the Internet, it is nothing but a time-sucking vortex from hell."

        1. Hallo,

          Die Frage ist nun:
          Was hast du unternommen, um naehere Informationen diesbezueglich zu finden?

          Ich weiß nicht, mit welchen Suchbegriffen ich suchen könnte.
          Ich habe schon mal beispilehaft weitere Sonderzeichen getestet. Natürlich könnte ich alle testen. Ich hätte dann eine Teilantwort auf meine Fragen, allerdings keine Erklärung warum z.B. "<" ein gültiges Zeichen in einer URL ist (zumindest wird es nicht behandelt wie '#'). Aus den bisherigen Test müsste ich schließen, dass mit Ausnahme weniger Sonderzeichen alle innerhalb einer URL zulässig sin, was ich mir nicht vorstellen kann.
          Noch verwirrender ist, dass aus www.foo.com° z.B. www.foo.xn--com-ufa/ erzeugt wird.
          Gruß
          Connie

          1. Ich weiß nicht, mit welchen Suchbegriffen ich suchen könnte.

            wie wärs mit "URL spezifikation" oder ähnliches, führt mich mit etwas kreativem klicken durch die sucherbegnisse und anpassen meiner suchbegriffe zu folgendem dokument
            http://www.faqs.org/rfcs/rfc1738.html

            Noch verwirrender ist, dass aus www.foo.com° z.B. www.foo.xn--com-ufa/ erzeugt wird.

            hier könnte folgendes für dich in frage kommen - landläufig ist das was du beschreibst eine "umlautdomain" (idn)
            http://www.faqs.org/rfcs/rfc3490.html

            1. Hallo,

              Noch verwirrender ist, dass aus www.foo.com° z.B. www.foo.xn--com-ufa/ erzeugt wird.

              hier könnte folgendes für dich in frage kommen - landläufig ist das was du beschreibst eine "umlautdomain" (idn)

              Also bei dem Zeichen ° wäre ich nie darauf gekommen, dass dies ein Umlaut sein soll!
              Gruß
              Connie

              1. Mahlzeit,

                Also bei dem Zeichen ° wäre ich nie darauf gekommen, dass dies ein Umlaut sein soll!

                Ist es auch nicht. Aber es gibt mehr Ding' im Himmel und auf Erden, als Deine Schulweisheit sich träumt. Unter anderem auch noch mehr "Sonderzeichen" als nur deutsche Umlaute. Informiere Dich zum Thema IDN (hatte suit Dir auch bereits genannt).

                MfG,
                EKKi

                --
                sh:( fo:| ch:? rl:( br:> n4:~ ie:% mo:} va:) de:] zu:) fl:{ ss:) ls:& js:|

              2. Also bei dem Zeichen ° wäre ich nie darauf gekommen, dass dies ein Umlaut sein soll!

                ist es auch nicht - der ring ° (das grad-zeichen, also U+00B0) ist ein "normal" ansi-zeichen

                IDNs werden werden eben nur landläufig umlaut-domains genannt, weil die meisten top-level-provider/-sponsoren nur umlaute erlauben, aber keine anderen sonderzeichen

                prinzipell ist in einem idn jedes[1] sonderzeichen möglich, muss aber dann entsprechend codiert werden

                [1] mit ausnahmen, punkte z.B.

                1. Also bei dem Zeichen ° wäre ich nie darauf gekommen, dass dies ein Umlaut sein soll!

                  ist es auch nicht - der ring ° (das grad-zeichen, also U+00B0) ist ein "normal" ansi-zeichen

                  IDNs werden werden eben nur landläufig umlaut-domains genannt, weil die meisten top-level-provider/-sponsoren nur umlaute erlauben, aber keine anderen sonderzeichen

                  Ja, woher soll man das wissen, dass Umlaute ungleich Umlaute!
                  Habe mal in der Mathematik gelernt, dass Definitionen ein(ein)deutig sein sollen.
                  Gruß
                  Connie

                  1. Ja, woher soll man das wissen, dass Umlaute ungleich Umlaute!

                    umlaute sind umlaute und werden immer solche bleiben - im deutschen gibt es drei ä, ö und ü (bzw deren großschreibung)

                    15°C.example.com (xn--15c-tfa.example.com) ist aber landläufig eine umlaut-domain obwohl da drin kein einziger umlaut vorkommt

                    Habe mal in der Mathematik gelernt, dass Definitionen ein(ein)deutig sein sollen.

                    die defintion was ein umlaut ist, ist exakt geregelt - wie gesagt, der volksmund (landläufig) sagt, es sind umlaut-domains

                    genauso wie "die sonne geht auf, die sonne geht unter" - tut sie nicht, die erde rotiert um die eigene achse (taumelnd) und erzeugt durch das wegdrehen tag/nacht-unterschied

                    1. die defintion was ein umlaut ist, ist exakt geregelt - wie gesagt, der volksmund (landläufig) sagt, es sind umlaut-domains

                      Wir sollten aber in einem Forum, das andern eine Hilfe sein soll, nicht mit volkstümlichen Beschreibungen kommen, sonst gibt es diese Verwirrungen.

                      1. Wir sollten aber in einem Forum, das andern eine Hilfe sein soll, nicht mit volkstümlichen Beschreibungen kommen, sonst gibt es diese Verwirrungen.

                        drum hab ich ja ausdrücklich dazugeschrieben, dass es landläufig so genannt wird und zusätzlich hab ichs in anführugnszeichen gesetzt ;) ich gehe davon aus, dass dies nicht als exakte technische defintion interpretiert wird ;)

            2. @@suit:

              wie wärs mit "URL spezifikation" oder ähnliches, führt mich mit etwas kreativem klicken durch die sucherbegnisse und anpassen meiner suchbegriffe zu folgendem dokument
              http://www.faqs.org/rfcs/rfc1738.html

              Autsch. Mit [RFC1738] bist du mindestens ein Jahrzehnt der Zeit hinterher. Schon dessen Nachfolger [RFC2396] ist inzwischen veraltet. Aktuell ist [RFC3986].

              Live long and prosper,
              Gunnar

              -- “New Jersey Hall of Fame? […] But then I ran through the list of names: Albert Einstein, Bruce Springsteen... my mother's going to like that. […] it's the only time she's going to hear those two names mentioned in the same sentence, so I'm going to enjoy it.” (Bruce Springsteen when inducted into the New Jersey Hall of Fame, 2008-05-04)
              1. Autsch. Mit [RFC1738] bist du mindestens ein Jahrzehnt der Zeit hinterher. Schon dessen Nachfolger [RFC2396] ist inzwischen veraltet. Aktuell ist [RFC3986].

                gut zu wissen ;)
                btw: ich vertrete die meinung, dass idns ohnein "fürn arsch" sind - umlaute sollte man verbieten - wenn ich jemals einen domainnamen in chinesischen schriftzeichen eingeben muss, dreh ich durch ;) und das soll barrieren im internet abbauen? tolle idee

                1. @@suit:

                  btw: ich vertrete die meinung, dass idns ohnein "fürn arsch" sind - umlaute sollte man verbieten

                  Ich nicht. Man sollte nicht die Beschränktheit der englischen Sprache auf die Welt loslassen und 'ä', 'á', 'ą',… als „Sonder“-Zeichen betrachten – schließlich sind es ganz normale Buchstaben.

                  wenn ich jemals einen domainnamen in chinesischen schriftzeichen eingeben muss, dreh ich durch ;)

                  Warum solltest du das je müssen?

                  und das soll barrieren im internet abbauen? tolle idee

                  Ja. Ja.

                  Live long and prosper,
                  Gunnar

                  -- “New Jersey Hall of Fame? […] But then I ran through the list of names: Albert Einstein, Bruce Springsteen... my mother's going to like that. […] it's the only time she's going to hear those two names mentioned in the same sentence, so I'm going to enjoy it.” (Bruce Springsteen when inducted into the New Jersey Hall of Fame, 2008-05-04)
                  1. Ja. Ja.

                    der erste gelbe kaste von dort:
                    Imagine, for example, that all web addresses had to be written in Japanese katakana, as shown in the example below. How easy would it be for you, if you weren't Japanese, to do things like recognize the content or owner of the site, type the address in your browser, write the URI down on notepaper, etc.?

                        * http://ヒキワリ.ナットウ.ニホン

                    genau das ist das problem - idna werden zwar übersetzt übersetzt, aber was bringt es mir, wenn ich auf einem werbeflyer http://任天堂株式会社.ニホン zu lesen bekomme? - tolle sache, ich kann das weder in meinem browser eingeben noch sonst irgendwie erreichen weil ich die zeichen niemals finden werden - http://nintendo.jp ist da ja gleich viel einfach einzugeben

                    sry fürs verdrehen der reihenfolge

                    Ich nicht. Man sollte nicht die Beschränktheit der englischen Sprache auf die Welt loslassen und 'ä', 'á', 'ą',… als „Sonder“-Zeichen betrachten – schließlich sind es ganz normale Buchstaben.

                    natürlich sind es ganz normale buchstaben, aber was ist mit anderen zeichen die ich nicht auf meiner tastatur habe? ich will mir bei art lebedev das optimus maximus keyboard bestellen

                    auf deren werbefoldern steht aber http://СтудияАртемияЛебедева.ru oder so drauf - das kann ich niemals eintippen

                    wenn man zeichen verwendet, die jeder auf seiner tastatur hat, sperrt man weniger potentielle kunden aus

                    natürlich sehe ich die für uns gebräuchlichen umlaute nicht als sonderzeichen, aber der 08/15-benutzer tut sich einfach schwer ein á einzugeben - vielleicht schafft er das noch, weill er mit grave/akut umgehen kann - aber wie siehts mit ǎ aus? da müsste ich selbst in einer zeichentabelle nachschaun, weil ich das nicht mehr auswendig weiss - und das verursacht barrieren

                    wenn ich nichtmal bei in meinen machbarland (tschechien) in einem onlineshop bestellen kann, weil ich den domainnamen von einem blatt papier nicht abtippen kann oder mit den jemand am telefon ansagt, ist das für den betreiber der website keine tolle sache

                    darum ist es meiner meinung nach schlau, sich auf den kleinsten gemeinsamen nenner - also ascii-zeichen - zu beschränken, wenn man möglichst viele kunden erreichen will

                    1. Hallo suit,

                      http://nintendo.jp ist da ja gleich viel einfach einzugeben

                      Eben, darum geht es doch! Die einfache eingabe von URLs. Und für einen Japaner ist http://nintendo.jp eben nicht einfach einzugeben.

                      Natürlich wird ein Unternehmen, das auch auf internationale Kundschaft abziehlt, nicht umhin können, auch eine "internationale" Variante ihrer Domain zu verwenden. Aber warum sollte es ein japanisches Unternehmen seinen Kunden vor Ort nicht leichter machen dürfen, indem die Seiten auch über eine lokale Variante der Domain erreichbar sind?

                      Viele Grüße
                      Carsten

                      --
                      Doctype-Switch? Quirks Mode? Standards Mode? Was is'n das?

                    2. @@suit:

                      auf deren werbefoldern steht aber http://СтудияАртемияЛебедева.ru oder so drauf - das kann ich niemals eintippen

                      Russisch Sprechende aber, denn die haben wohl einen russischen Tastaturtreiber. Und für diese ist die Webseite ja gedacht.

                      Es ist sicher nicht schlau, ausschließlich diese Domain zu betreiben, sondern auch eine entsprechende mit Basic-Latin-Zeichen.

                      wenn man zeichen verwendet, die jeder auf seiner tastatur hat, sperrt man weniger potentielle kunden aus

                      Eben. Besagte Russisch Sprechende haben vielleicht gar keinen Tastaturtreiber für lateinische Buchstaben?

                      darum ist es meiner meinung nach schlau, sich auf den kleinsten gemeinsamen nenner - also ascii-zeichen - zu beschränken,

                      Für Milliarden von Menschen sind ASCII-Zeichen nicht der kleinste gemeinsame Nenner, sondern „Sonderzeichen“.

                      Live long and prosper,
                      Gunnar

                      -- “New Jersey Hall of Fame? […] But then I ran through the list of names: Albert Einstein, Bruce Springsteen... my mother's going to like that. […] it's the only time she's going to hear those two names mentioned in the same sentence, so I'm going to enjoy it.” (Bruce Springsteen when inducted into the New Jersey Hall of Fame, 2008-05-04)
                      1. Eben. Besagte Russisch Sprechende haben vielleicht gar keinen Tastaturtreiber für lateinische Buchstaben?

                        Für Milliarden von Menschen sind ASCII-Zeichen nicht der kleinste gemeinsame Nenner, sondern „Sonderzeichen“.

                        natürlich, komplexe schriften, die aus "sonderzeichen" bestehen sind da durchaus praktikabel - aber was stört die leute an kaese.example.com im vergleich zu käse.example.com

                        durch das first come, first serve prinzip bei den meisten toplevels führt das zu willkürlichem domaingrabbing oder pauschalbelgungen durch grosskonzerne

                        konkretes beispiel: http://www.kaesewelt.at/ und http://www.käsewelt.at/ erster war vorher da, zweite wurde vom spar-konzern offenbar nur mal "pauschal" registiert

                        in solchen fällen wäre eine autmatische doppelvergabe bzw übersetzung angebrachter gewesen - beim scharfen s wurde das gemacht groß.example.com wird zu gross.example.com - warum ist das nicht auch bei umlauten möglich gewesen?

                        damit ist es für den benutzer egal - in einem radiospot wäre es fürs obrige beispiel schon beinahe lächerlich
                        "besuchen sie uns zu einer führung in unserer käserei oder im internet unter w w w punkt käsehof punkt at (aber bitte schreiben sie ae statt ä!)

                        natürlich ist das obrige beispiel auch eine rechtliche sache, aber es gibt auch ohne diese doppel-domains die durch umlaute entstehen genug leute die falschschreibungen oder tippfehler ausnutzen (die zig google-klone sind nur ein beispiel dafür)

                        1. @@suit:

                          Für Milliarden von Menschen sind ASCII-Zeichen nicht der kleinste gemeinsame Nenner, sondern „Sonderzeichen“.

                          natürlich, komplexe schriften, die aus "sonderzeichen" bestehen sind da durchaus praktikabel - aber was stört die leute an kaese.example.com im vergleich zu käse.example.com

                          Nichts. Es sollte beides möglich sein. Und beides denselben Inhalt haben; also hinter dem einen IRI eine Weiterleitung auf den anderen stecken.

                          durch das first come, first serve prinzip bei den meisten toplevels führt das zu willkürlichem domaingrabbing oder pauschalbelgungen durch grosskonzerne

                          Internationalisierung von IRIs ist ein technisches roblem, Domaingrabbing ein juristisches. Man sollte nicht nützliche Technik unterbinden, nur weil sie irgendwer missbrauchen könnte.

                          konkretes beispiel: http://www.kaesewelt.at/ und http://www.käsewelt.at/ erster war vorher da, zweite wurde vom spar-konzern offenbar nur mal "pauschal" registiert

                          Frag die zuständige NIC.

                          in solchen fällen wäre eine autmatische doppelvergabe bzw übersetzung angebrachter gewesen - beim scharfen s wurde das gemacht groß.example.com wird zu gross.example.com - warum ist das nicht auch bei umlauten möglich gewesen?

                          Frag die zuständige NIC.

                          Live long and prosper,
                          Gunnar

                          -- “New Jersey Hall of Fame? […] But then I ran through the list of names: Albert Einstein, Bruce Springsteen... my mother's going to like that. […] it's the only time she's going to hear those two names mentioned in the same sentence, so I'm going to enjoy it.” (Bruce Springsteen when inducted into the New Jersey Hall of Fame, 2008-05-04)
          2. Hi,

            Ich weiß nicht, mit welchen Suchbegriffen ich suchen könnte.

            Das, was dich interessiert, ist wohl in erster Linie ein URL bzw. URI, bzw. bestimmte Bestandteile davon.
            Und grosszuegig, wie die Wikipedia ist, verlinkt sie dich auch auf weitere Quellen - u.a. die entsprechenden RFCs - die tiefer gehendes Interesse an der Thematik befriedigen koennen.

            MfG ChrisB

            --
            "The Internet: Technological marvel of marvels - but if you don't know *what* you're lookin' for on the Internet, it is nothing but a time-sucking vortex from hell."

            1. Hallo,

              Das, was dich interessiert, ist wohl in erster Linie ein URL bzw. URI, bzw. bestimmte Bestandteile davon.
              Und grosszuegig, wie die Wikipedia ist, verlinkt sie dich auch auf weitere Quellen - u.a. die entsprechenden RFCs - die tiefer gehendes Interesse an der Thematik befriedigen koennen.

              Ich möchte ja gar nicht tiefer eindringen.
              Um zu erfahren, welche Zeichen zulässig sind, kann es doch nicht wahr sein, dass ich Hunderte von Seiten in zig Dokumenten studiere.
              Ein Test ergab übrigens, dass alle Sonderzeichen auf meiner Tastatur innerhalb einer URL akzeptiert wurden (mit unterschiedlichen Wirkungen) bis auf @, da kam die Meldung "Die URL ist ungültig".
              Schönen Tag
              Connie

              1. @@Connie:

                Um zu erfahren, welche Zeichen zulässig sind, kann es doch nicht wahr sein, dass ich Hunderte von Seiten in zig Dokumenten studiere.

                Nicht zig Dokumente, sondern eins [RFC3986].

                Nicht hunderte von Seiten, sondern die Abschnitte 2 Characters und 3 Syntax Components.

                Live long and prosper,
                Gunnar

                -- “New Jersey Hall of Fame? […] But then I ran through the list of names: Albert Einstein, Bruce Springsteen... my mother's going to like that. […] it's the only time she's going to hear those two names mentioned in the same sentence, so I'm going to enjoy it.” (Bruce Springsteen when inducted into the New Jersey Hall of Fame, 2008-05-04)
                1. Hi,
                  und da stößt man dann auf gen-delims und sub-delims. Um das zu verstehen muss man dann wieder suchen und suchen: Für sub-delims habe ich z.B. in dem Dokument zwar gefunden, welche Zeichen diese sind, nicht aber welche Funktion sub-delims haben.

                  Und um nachfolgendes zu verstehen, muss man schon sehr versiert sein in der Internet-Welt:

                     The purpose of reserved characters is to provide a set of delimiting
                     characters that are distinguishable from other data within a URI.
                     URIs that differ in the replacement of a reserved character with its
                     corresponding percent-encoded octet are not equivalent.  Percent-
                     encoding a reserved character, or decoding a percent-encoded octet
                     that corresponds to a reserved character, will change how the URI is
                     interpreted by most applications.  Thus, characters in the reserved
                     set are protected from normalization and are therefore safe to be
                     used by scheme-specific and producer-specific algorithms for
                     delimiting data subcomponents within a URI.
                  Gruß
                  Connie

              2. Hi,

                Ein Test ergab übrigens, dass alle Sonderzeichen auf meiner Tastatur innerhalb einer URL akzeptiert wurden (mit unterschiedlichen Wirkungen) bis auf @, da kam die Meldung "Die URL ist ungültig".

                ... was aber wiederum daran liegt, dass du einen kastrierten Browser verwendest (muss wohl IE6 oder IE7 sein). Andere akzeptieren nämlich die Notation http://user:passwd@example.org/ für Ressourcen, die HTTP-AUTH erfordern (auch wenn diese Notation bei HTTP gerade nicht standardisiert ist).

                So long,
                 Martin

                --
                Niemand lebt allein von seinen Träumen.
                Aber wer träumt, lebt noch.

                1. @@Der Martin:

                  ... was aber wiederum daran liegt, dass du einen kastrierten Browser verwendest (muss wohl IE6 oder IE7 sein).

                  Das sagt ein IE5-Nutzer? ;-)

                  Live long and prosper,
                  Gunnar

                  -- “New Jersey Hall of Fame? […] But then I ran through the list of names: Albert Einstein, Bruce Springsteen... my mother's going to like that. […] it's the only time she's going to hear those two names mentioned in the same sentence, so I'm going to enjoy it.” (Bruce Springsteen when inducted into the New Jersey Hall of Fame, 2008-05-04)
                  1. ... was aber wiederum daran liegt, dass du einen kastrierten Browser verwendest (muss wohl IE6 oder IE7 sein).

                    Das sagt ein IE5-Nutzer? ;-)

                    die ie7 versteht idn problemlos - nur der ie6 abwährts kann das nicht ;) von der seite ist unfair einen browser als kastriert zu bezeichnen, wenn ein feature einfach noch nicht implementiert wurde weil er zu alt ist

                    wenn ein standardisiertes feature bereits eingebaut war und wieder entfernt wurde darf man von kastriert sprechen

                    der ie5-nutzer wird seinen browser also sicher auch nicht wegen der fehlenden idn-unterstützung als kastriert bezeichnen

                  2. Hi Gunnar,

                    ... was aber wiederum daran liegt, dass du einen kastrierten Browser verwendest (muss wohl IE6 oder IE7 sein).

                    Das sagt ein IE5-Nutzer? ;-)

                    ja, denn der IE5 hat das Problem nicht. Diese Kastration wurde erst beim IE6 vorgenommen.

                    Und damit suit mich nicht falsch versteht: Ich weiß, dass der IE bis einschließlich Version 6 mit IDNs nichts anfangen kann. Das meinte ich aber nicht, sondern nur, dass ein Feature, das -obwohl nicht vorgeschrieben- bis Version 5 existierte, in der Folgeversion plötzlich deaktiviert[1] wurde.

                    Ciao,
                     Martin

                    [1] Ja, deaktiviert: Es wurde nicht komplett entfernt; man kann es zum Glück durch einen Registry-Eingriff wieder freischalten.

                    -- Es gibt Dinge, die sind sooo falsch, dass nicht einmal das Gegenteil stimmt.
                2. ... was aber wiederum daran liegt, dass du einen kastrierten Browser verwendest (muss wohl IE6 oder IE7 sein). Andere akzeptieren nämlich die Notation http://user:passwd@example.org/ für Ressourcen, die HTTP-AUTH erfordern (auch wenn diese Notation bei HTTP gerade nicht standardisiert ist).

                  Falsch getippt! Firefox!