Alfie: Redirect encoded "?" und "="

Hallo!

Einige Einträge in meinem Forum sind in Publikationen encodiert verlinkt und führen zu einem 404er.
Übliches Format: https://example.com/foo.php?id=bar
Verlinkt: https://example.com//foo.php%3fid%3dbar (manchmal auch %3F und %3D)

In der .htaccess
Redirect permanent /foo.php%3fid%3dbar https://example.com/foo.php?id=bar
hilft nicht.

Vorschläge/Ideen?

  1. Hello,

    alle Daten, die per URL-Parameter transportiert werden sollen, müssen komplett codiert werden. Bei allen Daten, die zur URL gehören, dürfen nur die Werte codiert werden, nicht aber die Steuer-/Funktionszeichen [?=&;] (reservierte Zeichen).

    Im HTML muss auch das & codiert werden, da es dort bereits eine Sonderbedeutung hat.

    Glück Auf
    Tom vom Berg

    --
    Es gibt nichts Gutes, außer man tut es!
    Das Leben selbst ist der Sinn.
    1. Hallo,

      alle Daten, die per URL-Parameter transportiert werden sollen, müssen komplett codiert werden. Bei allen Daten, die zur URL gehören, dürfen nur die Werte codiert werden, nicht aber die Steuerzeichen [?&;].

      Na schön, aber dass große Wissenschaftsverlage (Springer, Elsevier) die Verlinkung versemmeln habe ich keinen Einfluss.

      Really no way out?

      1. Hi,

        alle Daten, die per URL-Parameter transportiert werden sollen, müssen komplett codiert werden. Bei allen Daten, die zur URL gehören, dürfen nur die Werte codiert werden, nicht aber die Steuerzeichen [?&;].

        ich musste den Satz dreimal konzentriert lesen, bis ich ihn verstanden hatte und dann doch der Meinung war: Ja, stimmt.

        Na schön, aber dass große Wissenschaftsverlage (Springer, Elsevier) die Verlinkung versemmeln habe ich keinen Einfluss.

        Stimmt leider auch.

        Really no way out?

        I'm afraid no. So wie du es beschreibst, sind es Fremdanbieter, die Einträge bei dir verlinken und das leider falsch machen.

        Hast du schon mal versucht, die Verantwortlichen der anderen Plattformen anzuschreiben und um Klärung zu bitten? Nenn ein oder zwei konkrete Beispiele und hoffe, dass die das Problem erkennen.
        Kann natürlich sein, dass das in eine Runde Schwarzer Peter mündet: Nö, auf unserer Seite ist alles korrekt!

        Schönen Sonntag noch,
         Martin

        --
        Computer müssen weiblich sein: Eigensinnig, schwer zu durchschauen, immer für Überraschungen gut - aber man möchte sie nicht missen.
        1. Hallo,

          I'm afraid no. So wie du es beschreibst, sind es Fremdanbieter, die Einträge bei dir verlinken und das leider falsch machen.

          Hast du schon mal versucht, die Verantwortlichen der anderen Plattformen anzuschreiben und um Klärung zu bitten? Nenn ein oder zwei konkrete Beispiele und hoffe, dass die das Problem erkennen.
          Kann natürlich sein, dass das in eine Runde Schwarzer Peter mündet: Nö, auf unserer Seite ist alles korrekt!

          Das geht Zillion-Euro-Unternehmen vermutlich am A** vorbei. Der Link in den PDFs wird zwar korrekt dargestellt

          Link im PDF

          … dahinter verbirgt sich aber eben http://forum.bebac.at/mix_entry.php%3fid%3d10202

          Abtippen ist mühsam.

          1. Hello,

            I'm afraid no. So wie du es beschreibst, sind es Fremdanbieter, die Einträge bei dir verlinken und das leider falsch machen.

            Hast du schon mal versucht, die Verantwortlichen der anderen Plattformen anzuschreiben und um Klärung zu bitten? Nenn ein oder zwei konkrete Beispiele und hoffe, dass die das Problem erkennen.
            Kann natürlich sein, dass das in eine Runde Schwarzer Peter mündet: Nö, auf unserer Seite ist alles korrekt!

            Das geht Zillion-Euro-Unternehmen vermutlich am A** vorbei. Der Link in den PDFs wird zwar korrekt dargestellt

            Link im PDF

            … dahinter verbirgt sich aber eben http://forum.bebac.at/mix_entry.php%3fid%3d10202

            Mach dein Zielsystem tolerant, wie im anderen Posting beschrieben. :-)

            Und nutze für den korrigierten Request einen Roundturn mit moved permanently- Header.

            Glück Auf
            Tom vom Berg

            --
            Es gibt nichts Gutes, außer man tut es!
            Das Leben selbst ist der Sinn.
          2. Hi,

            Das geht Zillion-Euro-Unternehmen vermutlich am A** vorbei.

            ja, vermutlich. Mir war nicht klar, dass es um Unternehmen dieser Größenordnung geht. Außer Springer ist mir keiner der Namen, die du als Beispiel nennst, überhaupt bekannt.

            Der Link in den PDFs wird zwar korrekt dargestellt

            Ah! Es geht um PDFs! Ich bin von herkömmlichen Webseiten ausgegangen.
            Links in PDF-Dokumenten sind meiner Erfahrung nach immer ein Glücksspiel.

            Link im PDF

            … dahinter verbirgt sich aber eben http://forum.bebac.at/mix_entry.php%3fid%3d10202

            Abtippen ist mühsam.

            Ja. Und Copy&Paste ist ein Notbehelf, aber nicht wirklich schön. Und wer kommt schon auf die Idee, wenn man doch scheinbar einfach den Link anklicken kann?
            Nur jemand, der auch Links in Google-Ergebnislisten nicht direkt anklickt, sondern (um das Tracking ein bisschen zu umgehen) die angezeigten URLs kopiert und in die Adresszeile einfügt. ;-)

            So long,
             Martin

            --
            Computer müssen weiblich sein: Eigensinnig, schwer zu durchschauen, immer für Überraschungen gut - aber man möchte sie nicht missen.
            1. Hallo Martin,

              Der Link in den PDFs wird zwar korrekt dargestellt

              Ah! Es geht um PDFs! Ich bin von herkömmlichen Webseiten ausgegangen.
              Links in PDF-Dokumenten sind meiner Erfahrung nach immer ein Glücksspiel.

              Nicht nur (siehe meine Antwort an Tom).

              Abtippen ist mühsam.

              Ja. Und Copy&Paste ist ein Notbehelf, aber nicht wirklich schön.

              Jenau.

              Und wer kommt schon auf die Idee, wenn man doch scheinbar einfach den Link anklicken kann?

              Ebent.

            2. @@Der Martin

              Und wer kommt schon auf die Idee, wenn man doch scheinbar einfach den Link anklicken kann?
              Nur jemand, der auch Links in Google-Ergebnislisten nicht direkt anklickt, sondern (um das Tracking ein bisschen zu umgehen) die angezeigten URLs kopiert und in die Adresszeile einfügt. ;-)

              Wer das Tracking umgehen will, der kommt gar nicht erst auf die Idee, Google zu verwenden. Der sucht bei DuckDuckGo oder einer anderen Alternative.

              LLAP 🖖

              --
              „Man kann sich halt nicht sicher sein“, sagt der Mann auf der Straße, „dass in einer Gruppe Flüchtlinge nicht auch Arschlöcher sind.“
              „Stimmt wohl“, sagt das Känguru, „aber immerhin kann man sich sicher sein, dass in einer Gruppe Rassisten nur Arschlöcher sind.“

              —Marc-Uwe Kling
              1. Hello,

                @@Der Martin

                Und wer kommt schon auf die Idee, wenn man doch scheinbar einfach den Link anklicken kann?
                Nur jemand, der auch Links in Google-Ergebnislisten nicht direkt anklickt, sondern (um das Tracking ein bisschen zu umgehen) die angezeigten URLs kopiert und in die Adresszeile einfügt. ;-)

                Wer das Tracking umgehen will, der kommt gar nicht erst auf die Idee, Google zu verwenden. Der sucht bei DuckDuckGo oder einer anderen Alternative.

                Typisch Gunnar! ;-)

                Aber wenn man in DuckDuckGo mal nach %3f suchen lässt, erhält man gleich als erste einige sehr intetessante Links zum Thema.

                Glück Auf
                Tom vom Berg

                --
                Es gibt nichts Gutes, außer man tut es!
                Das Leben selbst ist der Sinn.
              2. Hallo Gunnar,

                Wer das Tracking umgehen will, der kommt gar nicht erst auf die Idee, Google zu verwenden. Der sucht bei DuckDuckGo

                hatte ich auch mal ausprobiert und sofort wieder von der Kandidatenliste gestrichen. Denn DuckDuckGo schickt das Suchformular per POST ab. Damit kann man weder Suchanfragen verlinken, noch die Anfrage direkt in die Adresszeile eingeben (z.B. https://www.google.de/search?q=hommingberger+gepardenforelle), wie ich es gewöhnt bin.

                Und bing mag ich nicht, weil's von Microsoft kommt. ;-)

                Ciao,
                 Martin

                --
                Computer müssen weiblich sein: Eigensinnig, schwer zu durchschauen, immer für Überraschungen gut - aber man möchte sie nicht missen.
                1. Hallo,

                  Damit kann man weder Suchanfragen verlinken,

                  Was hältst du davon ein Suchergebnis zu verlinken?

                  noch die Anfrage direkt in die Adresszeile eingeben (z.B. https://www.google.de/search?q=hommingberger+gepardenforelle), wie ich es gewöhnt bin.

                  Klar kann man die Suchanfrage direkt in die Adresszeile eingeben.

                  DDG hat außerdem ein Feature, das ich nicht mehr missen möchte: direkte Angabe einer bestimmten Site, in der gesucht werden soll. Bspw. sucht "hommingberger Leopardenguglhupf!wde" gleich in der deutsche Wikipedia. !w steht für die englische WP, !yt steht für Youtube und so weiter...

                  Gruß
                  Kalk

                  Edith weiß, dass das Feature "Bang" heißt und wo die Liste zu finden ist: Liste der Bangs

                  1. @@Tabellenkalk

                    Klar kann man die Suchanfrage direkt in die Adresszeile eingeben.

                    Und zwar ebenso wie bei den Überwachungskapitalisten mit q: https://duckduckgo.com/?q=hommingberger+gepardenforelle

                    Edith weiß, dass das Feature "Bang" heißt und wo die Liste zu finden ist: Liste der Bangs

                    Mein meistgebräuchlichstes ist !mdn (wenn ich mal nicht gleich auf MDN suche).

                    LLAP 🖖

                    --
                    „Man kann sich halt nicht sicher sein“, sagt der Mann auf der Straße, „dass in einer Gruppe Flüchtlinge nicht auch Arschlöcher sind.“
                    „Stimmt wohl“, sagt das Känguru, „aber immerhin kann man sich sicher sein, dass in einer Gruppe Rassisten nur Arschlöcher sind.“

                    —Marc-Uwe Kling
                    1. Hallo Gunnar Bittersmann,

                      Mein meistgebräuchlichstes ist !mdn (wenn ich mal nicht gleich auf MDN suche).

                      https://duckduckgo.com/bang?q=selfhtml

                      Bis demnächst
                      Matthias

                      --
                      Pantoffeltierchen haben keine Hobbys.
                      ¯\_(ツ)_/¯
            3. Hallo

              Das geht Zillion-Euro-Unternehmen vermutlich am A** vorbei.

              ja, vermutlich. Mir war nicht klar, dass es um Unternehmen dieser Größenordnung geht. Außer Springer ist mir keiner der Namen, die du als Beispiel nennst, überhaupt bekannt.

              Und vermutlich kennst du zu allem Überfluss den falschen Springer-Verlag. Hier geht es nicht um den Axel Springer Verlag, der die Bild, die Welt und ähnliche Publikationen herausgibt, sondern um den Verlag Springer Science+Business Media. 😁

              Tschö, Auge

              --
              Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
              Hohle Köpfe von Terry Pratchett
              1. Moin,

                Mir war nicht klar, dass es um Unternehmen dieser Größenordnung geht. Außer Springer ist mir keiner der Namen, die du als Beispiel nennst, überhaupt bekannt.

                Und vermutlich kennst du zu allem Überfluss den falschen Springer-Verlag. Hier geht es nicht um den Axel Springer Verlag, der die Bild, die Welt und ähnliche Publikationen herausgibt, sondern um den Verlag Springer Science+Business Media. 😁

                hmm, erwischt.

                Ich dachte tatsächlich an den Bild-Herausgeber, den anderen kenne ich nicht.

                Ciao,
                 Martin

                --
                Computer müssen weiblich sein: Eigensinnig, schwer zu durchschauen, immer für Überraschungen gut - aber man möchte sie nicht missen.
                1. Hallo

                  Moin,

                  Mir war nicht klar, dass es um Unternehmen dieser Größenordnung geht. Außer Springer ist mir keiner der Namen, die du als Beispiel nennst, überhaupt bekannt.

                  Und vermutlich kennst du zu allem Überfluss den falschen Springer-Verlag. Hier geht es nicht um den Axel Springer Verlag, der die Bild, die Welt und ähnliche Publikationen herausgibt, sondern um den Verlag Springer Science+Business Media. 😁

                  hmm, erwischt.

                  😉

                  Ich dachte tatsächlich an den Bild-Herausgeber, den anderen kenne ich nicht.

                  Das dachte ich mir schon. Wer nicht im wissenschaftlichen Betrieb steckt oder sich für das Thema Open Data interessiert, wird die Namen von Verlagen wie Elsevier und Springer üblicherweise nicht kennen.

                  Tschö, Auge

                  --
                  Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
                  Hohle Köpfe von Terry Pratchett
                  1. @@Auge

                    Das dachte ich mir schon. Wer nicht im wissenschaftlichen Betrieb steckt oder sich für das Thema Open Data interessiert, wird die Namen von Verlagen wie Elsevier und Springer üblicherweise nicht kennen.

                    Oder wer Charlie Owen nicht kennt. Sie erzählt bei so ziemlich jedem Vortrag, dass sie nicht bei Axel Springer, sondern bei Springer Nature arbeitet – “the good Springer, not the evil one.”

                    LLAP 🖖

                    --
                    „Man kann sich halt nicht sicher sein“, sagt der Mann auf der Straße, „dass in einer Gruppe Flüchtlinge nicht auch Arschlöcher sind.“
                    „Stimmt wohl“, sagt das Känguru, „aber immerhin kann man sich sicher sein, dass in einer Gruppe Rassisten nur Arschlöcher sind.“

                    —Marc-Uwe Kling
                    1. Hallo

                      Das dachte ich mir schon. Wer nicht im wissenschaftlichen Betrieb steckt oder sich für das Thema Open Data interessiert, wird die Namen von Verlagen wie Elsevier und Springer üblicherweise nicht kennen.

                      Oder wer Charlie Owen nicht kennt. Sie erzählt bei so ziemlich jedem Vortrag, dass sie nicht bei Axel Springer, sondern bei Springer Nature arbeitet – “the good Springer, not the evil one.”

                      Mit dem Geschäftsgebaren der Wissenschaftsverlage, die dort Veröffentlichenden für die Veröffentlichung zahlen zu lassen, sie nirgendwo sonst veröffentlichen zu lassen und deren Institute nochmal zahlen zu lassen, um die Artikel ihrer eigenen [1] Mitarbeiter verwenden zu dürfen, zählen diese Verlage im Vergleich zu Axel Springer wohl bestenfalls zu den „not so evil one“.

                      Tschö, Auge

                      --
                      Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
                      Hohle Köpfe von Terry Pratchett

                      1. edit das Wort „eigenen“ der Verständlichkeit des Satzes wegen eingefügt. ↩︎

        2. Hello,

          alle Daten, die per URL-Parameter transportiert werden sollen, müssen komplett codiert werden. Bei allen Daten, die zur URL gehören, dürfen nur die Werte codiert werden, nicht aber die Steuerzeichen [?&;].

          ich musste den Satz dreimal konzentriert lesen, bis ich ihn verstanden hatte und dann doch der Meinung war: Ja, stimmt.

          Na schön, aber dass große Wissenschaftsverlage (Springer, Elsevier) die Verlinkung versemmeln habe ich keinen Einfluss.

          Stimmt leider auch.

          Really no way out?

          I'm afraid no. So wie du es beschreibst, sind es Fremdanbieter, die Einträge bei dir verlinken und das leider falsch machen.

          Hast du schon mal versucht, die Verantwortlichen der anderen Plattformen anzuschreiben und um Klärung zu bitten? Nenn ein oder zwei konkrete Beispiele und hoffe, dass die das Problem erkennen.
          Kann natürlich sein, dass das in eine Runde Schwarzer Peter mündet: Nö, auf unserer Seite ist alles korrekt!

          Vermutlich werden die sich denken, "das macht unser System doch automatisch, und das war teuer, also muss das richtig arbeiten".

          Dass URis aber erst in ihre Bestandteile zerlegt werden müssen, die dann decodiert, verändert und einzeln wieder codiert und dann erst wieder zusammengebaut werden dürfen, das können die wenigsten CMS richtig.

          Vermutlich kennen deren Erschaffer alle SelHTML nicht ;-p

          Da diese Vorgehensweise aber stereotyp ist, könnte Alfie versuchen, die korumpierten URis aufzufangen und per Script richtigzustellen. Also erst prüfen, ob es eine passende Ressource gibt, wenn nicht: weiterreichen an das Script, das dann schrittweise versucht, die Fehler zu korrigieren und schlussendlich hoffentlich dann die richtige Ressource findet.

          Diese sollte dann aber nicht (wie bei mod nego) ausgeliefert werden, sondern deren richtige URi mit http-Status moved permanently zurückgeschickt werden.

          Glück Auf
          Tom vom Berg

          --
          Es gibt nichts Gutes, außer man tut es!
          Das Leben selbst ist der Sinn.
      2. Hallo Alfie,

        Verlinkung versemmeln

        Hast Du eine Beispielseite mit einem solchen Link? Ich nehme zwar an, dass Du eine Versemmelung korrekt identifizieren kannst, aber ein Zweitblick drauf kann nicht schaden.

        Ich habe keinen Apache, ich habe nur im Handbuch gestöbert. Da steht bei redirect:

        The old URL-path is a case-sensitive (%-decoded) path beginning with a slash. A relative path is not allowed.

        Mir ist nicht klar, wie das %-decoded gemeint ist. Löst der Apache die % in der redirect Direktive auf, oder löst er erstmal die % im Request auf, bevor er die Direktive anwendet?

        Wenn es das erste ist, müsstest Du % durch %25 ersetzen.

        Wenn es das zweite ist, könnte es daran liegen, dass alle Redirect-Beispiele Anführungszeichen verwenden, du aber nicht.

        Es kann auch sein, dass das Wort "Path" der Schlüssel ist: Redirect matcht keine Parameter, es behält die URL-Parameter stattdessen bei. Das könntest Du dann ggf. mit mod_rewrite statt mod_alias lösen (wenn ich mod_rewrite richtig verstehe)

        Rolf

        --
        sumpsi - posui - clusi
        1. Hallo Rolf,

          Hast Du eine Beispielseite mit einem solchen Link? Ich nehme zwar an, dass Du eine Versemmelung korrekt identifizieren kannst, aber ein Zweitblick drauf kann nicht schaden.

          doi:10.1007%2Fs10928-019-09623-w

          Alle Artikel hinter happigen Paywalls (40 Euro aufwärts). Ein Screenshot und die hinterlegte URL in meiner Antwort an Martin.

          Zuerst dachte ich es liegt an der Weichware die das PDF erzeugt (Acrobat Distiller 10.1.8 für Windoofs). Wenn du aber dieser DOI folgst, sind unten auch die Referenzen. #26 ist der Übeltäter. Im Quelltext falsch. Beim Hovern zeigt FF in der Satuszeile den Text an, Chrome aber den encodierten.

          Über den Rest muss ich erst nachgrübeln.

          1. Hallo Alfie,

            dein bebac Link hat ein Alleinstellungsmerkmal: Es ist die einzige URL mit Parametern, die auch als URL angezeigt wird. Es gibt auch andere Parameter-URLs, aber die sind richtig.

            Frage ist nun, wie der Link da reingekommen ist. Sicherlich hat ihn ein Redakteur oder Wissenschaftsjournalist in ein CMS eingegeben. Und da mag es unterschiedliche Modi geben, von denen er den falschen ausgewählt hat.

            Wenn Du das bei Springer rügen willst, kannst Du den PubMed und Scholar-Eintrag von #27 als Vergleich benennen. Die sind richtig, sie können es also grundsätzlich. Das ist ein Erfassungsfehler. Oder ein Fehler beim Aufbereiten von Direktlinks.

            Rolf

            --
            sumpsi - posui - clusi
            1. Hallo Rolf,

              dein bebac Link hat ein Alleinstellungsmerkmal: Es ist die einzige URL mit Parametern, die auch als URL angezeigt wird. Es gibt auch andere Parameter-URLs, aber die sind richtig.

              Ah, danke! Ist mir gar nicht aufgefallen.

              Frage ist nun, wie der Link da reingekommen ist. Sicherlich hat ihn ein Redakteur oder Wissenschaftsjournalist in ein CMS eingegeben. Und da mag es unterschiedliche Modi geben, von denen er den falschen ausgewählt hat.

              Kann gut sein.

              Wenn Du das bei Springer rügen willst, kannst Du den PubMed und Scholar-Eintrag von #27 als Vergleich benennen. Die sind richtig, sie können es also grundsätzlich. Das ist ein Erfassungsfehler. Oder ein Fehler beim Aufbereiten von Direktlinks.

              Guter Hinweis. Ätzend natürlich für jemand der für das PDF bezahlt hat.

              1. Hallo Alfie,

                Ätzend natürlich für jemand der für das PDF bezahlt hat.

                Sicher. Aber das ist dann eine Sache zwischen ihm und Springer, oder?

                Und man kommt ja auf der verlinkten Seite über „Other things to try“ doch zum Ziel. Nur 2 Klicks mehr.

                Rolf

                --
                sumpsi - posui - clusi