tag:forum.selfhtml.org,2005:/self Ursprüngliche URL jeder Webseite des www anzeigen – SELFHTML-Forum 2011-05-08T14:25:30Z https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507362#m1507362 forumleaks dieweltist@yahoo.de http://weltrettungsforum.de.vu 2011-05-07T11:14:43Z 2011-05-07T11:14:43Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Zur Zeit arbeite ich an einem Vim-Makro, das den Quelltext irgendeiner Webseite in die in der Regel dort vorhandenen URLs umwandeln soll. Problematisch sind nur die relativen URL-Angaben, weil ich nicht weiß, auf welche URL sich diese beziehen.</p> <p>Wenn ich also irgendeine Webseite aufrufe und dann dessen Quelltext, beziehen sich dann die relativen URL-Angaben immer auf die in der Adresszeile angezeigte URL oder gegebenenfalls auf die ursprüngliche URL?</p> <p>Es gibt ja Webseiten, wo die Webadresse von beispielsweise ModRewrite in die eigentliche ursprüngliche URL dieser Seite umgewandelt wird. So kann es sein, dass die falsche Webadresse Ordner enthält, die bei der ursprünglichen URL gar nicht vorhanden sind.</p> <p>Wenn aber der Browser die nicht ursprüngliche URL mit den nicht vorhandenen Ordnern anzeigt, worauf beziehen sich dann die relativen URL-Angaben im Quelltext? Auf die angezeigte Weiterleitungs-URL oder auf die mir unbekannte ursprüngliche URL?</p> <p>Falls auf die unbekannte ursprüngliche URL; wie kann ich diese beispielsweise mit dem FireFox oder dem Internet Explorer oder notfalls irgend einem anderen Browser ermitteln? Oder steht diese ursprüngliche URL sogar irgendwo im Quelltext der Webseite?</p> <p>Übrigens wird dieses VIM-Makro in Kürze zum Download hier zur Verfügung stehen:</p> <p><a href="http://forumtreff.pytalhost.de/406" rel="nofollow noopener noreferrer">http://forumtreff.pytalhost.de/406</a></p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507376#m1507376 ChrisB 2011-05-07T11:22:09Z 2011-05-07T11:22:09Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Hi,</p> <blockquote> <p>Wenn ich also irgendeine Webseite aufrufe und dann dessen Quelltext, beziehen sich dann die relativen URL-Angaben immer auf die in der Adresszeile angezeigte URL oder gegebenenfalls auf die ursprüngliche URL?</p> </blockquote> <p>Natürlich auf die Adresse, von der der Client das Dokument erhalten hat - schließlich ist es Aufgabe des Clients, relative Pfadangaben zu vollständigen URLs zu ergänzen, bevor er eine Anfrage an den Server stellt.</p> <blockquote> <p>Es gibt ja Webseiten, wo die Webadresse von beispielsweise ModRewrite in die eigentliche ursprüngliche URL dieser Seite umgewandelt wird. So kann es sein, dass die falsche Webadresse Ordner enthält, die bei der ursprünglichen URL gar nicht vorhanden sind.</p> </blockquote> <p>Was der Server intern macht, ist dem Client vollkommen egal - der bekommt davon nichts mit.</p> <p>MfG ChrisB</p> <div class="signature">-- <br> RGB is totally confusing - I mean, at least #C0FFEE should be brown, right? </div> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507371#m1507371 dedlfix 2011-05-07T11:59:11Z 2011-05-07T11:59:11Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Hi!</p> <blockquote> <p>Zur Zeit arbeite ich an einem Vim-Makro, das den Quelltext irgendeiner Webseite in die in der Regel dort vorhandenen URLs umwandeln soll. Problematisch sind nur die relativen URL-Angaben, weil ich nicht weiß, auf welche URL sich diese beziehen.</p> </blockquote> <p>Das gleiche Lernpotential haben anscheinend auch die Autoren von in der Regel unerwünschten Bots. Die stückeln auch relative URL-Angaben irgendwie zusammen, nur nicht wie vorgesehen, und spammen damit als erstes das Error-Log voll.</p> <blockquote> <p>Wenn ich also irgendeine Webseite aufrufe und dann dessen Quelltext, beziehen sich dann die relativen URL-Angaben immer auf die in der Adresszeile angezeigte URL oder gegebenenfalls auf die ursprüngliche URL?</p> </blockquote> <p>Was soll denn die ursprüngliche URL konkret sein? Stell dir die Frage mal mit dem Hintergrund, dass du einem anderswo befindlichen Link folgst (Suchmaschine vielleicht) und "mittendrin" in einem Angebot auf einer beliebigen Seite landest. Wo ist dann deine ursprüngliche URL. Und warum sollte der Aufruf dieser Seite andere behandelt werden als wenn er über einen internen Link erfolgte?</p> <p>Im Web wird stets nur der Request und die zugehörige Response zusammen behandelt und alles andere davor ist irrelevant, weil es nicht geschehen sein muss, um eine bestimmte Seite aufzurufen.</p> <blockquote> <p>Es gibt ja Webseiten, wo die Webadresse von beispielsweise ModRewrite in die eigentliche ursprüngliche URL dieser Seite umgewandelt wird. So kann es sein, dass die falsche Webadresse Ordner enthält, die bei der ursprünglichen URL gar nicht vorhanden sind.</p> </blockquote> <p>Das wäre dann aber ein Fehler, den der mod_rewrite-Konfigurierende nicht beachtet hat. Ein Browser bekommt von einem mod_rewrite nichts mit. Wenn also jemand mod_rewrite einsetzt, muss er dafür sorgen, dass relative Verweise zur aufgerufenen URL passen.</p> <blockquote> <p>Wenn aber der Browser die nicht ursprüngliche URL mit den nicht vorhandenen Ordnern anzeigt, worauf beziehen sich dann die relativen URL-Angaben im Quelltext? Auf die angezeigte Weiterleitungs-URL oder auf die mir unbekannte ursprüngliche URL?</p> </blockquote> <p>Auch wenn eine Weiterleitung ausgeführt wurde, interessiert sich der Browser nur für die URL des neuen Requests und nicht für den ider die Requests die im Weiterleitungen als Antwort eingebracht haben. Denn derjenige, der gleich auf das neue Ziel geht, weiß von einer URL mit Weiterleitung nichts. Er muss genauso wie der Weitergeleitete den Inhalt der vorliegenden Seite interpertieren.</p> <blockquote> <p>Falls auf die unbekannte ursprüngliche URL; wie kann ich diese beispielsweise mit dem FireFox oder dem Internet Explorer oder notfalls irgend einem anderen Browser ermitteln? Oder steht diese ursprüngliche URL sogar irgendwo im Quelltext der Webseite?</p> </blockquote> <p>"Ursprüngliche URLs" könnte es in unendlicher Anzahl geben. Wie gesagt, interessiert nicht eine einzige davon.</p> <p>Lo!</p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507368#m1507368 hotti http://rolfrost.de 2011-05-07T17:43:00Z 2011-05-07T17:43:00Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Mode Rewrite mal ein bischen anders aufgeschrieben:</p> <p>RewriteRule 'angeforderter URI' 'anderer URI'<br> RewriteRule 'angeforderter URI' 'anderer URI' [R]</p> <p>Der 'angeforderte URI' ist der sog. REQUEST_URI unter diesem Namen ist er in der Serverumgebung zu finden. Der 'andere URI' kann ein serverinterner Prozess sein oder ein anderer URI auf dem gleichen Server. Wurde [R] geflaggt, erfolgt eine Redirection, d.h. der Client wird vermittels eines Location-Header zum 'anderer URI' geschickt, hierbei ändert sich die Adresszeile im Browser, der Browser requestet nacheinander zunächst den Ersten und dann den zweiten URI 'anderer URI'.</p> <p>Ohne [R] bleibt der Client auf dem REQUEST_URI, die Adresszeile ändert sich nicht.</p> <p>In beiden Fällen erwartet der Client eine Response von 'anderer URI'. Um die Verwirrung komplett zu machen, kann 'anderer URI' auch selbst einen Location-Header erzeugen (unabhängig von [R]) und den Client zu einem 'wiederum anderen URI' schicken.</p> <p>Zu Deiner Frage zu Relativen Pfadangaben in action, href, scr...</p> <p>Diese sind immer relativ zum REQUEST_URI, also zu dem URI, der letztendlich in der Adresszeile des Browsers steht.</p> <p>Nehmen wir [R] aus, der Request_Uri sei /foo/bar.html (konstant) hierdrin soll ein Link in href="baz.txt" notiert sein. Der Browser wird den relativen Link ergänzen, zu sehen, wenn Du mit dem Mauszeiger drüberfährst ist: /foo/baz.txt</p> <p>Mit {R] gilt die gleiche Beziehung, nur mit dem Unterschied, dass vom Request_Uri ausgehend auf eine andere Seite umgeleitet wird und sich damit ein neuer Request_Uri ergibt.</p> <p>Hotti</p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507366#m1507366 forumleaks dieweltist@yahoo.de http://forumtreff.pytalhost.de 2011-05-07T19:40:39Z 2011-05-07T19:40:39Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Danke an alle! Also (ausschließlich) die in der Adressleiste angezeigte URL ist maßgebend, zu der die relativen URL-Angaben passen müssen. Oder habe ich das falsch verstanden? Beispielsweise der Link zu meinem Beitrag, wo ich das Makro veröffentlichen werde, ist dieser:</p> <p><a href="http://forumtreff.pytalhost.de/406" rel="nofollow noopener noreferrer">http://forumtreff.pytalhost.de/406</a></p> <p>Nach Aufruf der URL steht aber in der Adressleiste die ursprüngliche URL so ungefähr da:</p> <p>http://forumtreff.pytalhost.de/viewtopic.php?t=406</p> <p>Auf welche dieser beiden URLs müssen sich nun die relativen Linkangaben beziehen?</p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507363#m1507363 forumleaks dieweltist@yahoo.de http://weltrettungsportal.de.vu 2011-05-07T20:19:02Z 2011-05-07T20:19:02Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Nur schade, dass die in der Adressleiste des Browsers angegebene URL nicht im Quelltext geschrieben steht, noch nicht mal relativ. Weil aber nicht bei allen Webseiten die angeforderte URL identisch mit der in der Adressleiste erscheinenden ist,</p> <p>muss diese URL dann vor jedem Makrostart manuell im zu bearbeitenden Dokument angegeben werden, was das manuelle Crawlen im Web dadurch unweigerlich leider etwas umständlicher machen wird. Oder es hätte jemand einen Tipp, wie man den Browser so umschalten kann, dass er diese URL irgendwo in den Quelltext mit hinein schreibt.</p> <p>Denn so ein Quelltext besteht ja aus schier beinahe unendlich vielen Meta-Angaben, sodass der eigentliche Inhalt im Body dann geradezu untergeht unter diesen vielen Meta-Infos.</p> <p>Ich vermute, dass dies sogar Absicht ist, dass man wahnsinnig werden soll, falls man sich mal einen Quelltext vorknüpft. Und dass man dann möglichst auch noch an einem Wutanfall zugrunde gehen soll; wenn man dann nämlich auch noch bemerkt, dass kein einziger dieser Metas das Wichtigste verrät, was die jeweilige Seite betrifft, nämlich deren eigentliche URL.</p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507365#m1507365 hotti http://rolfrost.de 2011-05-07T20:39:34Z 2011-05-07T20:39:34Z Ursprüngliche URL jeder Webseite des www anzeigen <blockquote> <p>Nur schade, dass die in der Adressleiste des Browsers angegebene URL nicht im Quelltext geschrieben steht, noch nicht mal relativ.</p> </blockquote> <p>Ich kann Dich trösten ;)<br> Dasselbe Probläm habe ich auch, wenn meine Callbackfunktionen eine Tabelle erzeugen, in der Tabelle brauche ich den Path als Link...</p> <p>Tipp von dedlfix (2): einfach weglassen. Da steht dann im Quelltext zwar noch weniger (1), aber beim Drüberfahren mit der Maus entsteht was Brauchbares.</p> <p>(1) z.B.: href="?download=xyz"</p> <p>(2) die Tage, steht weiter unten im Forum.</p> <p>Hotti</p> <div class="signature">-- <br> Beim Zertrampeln von Ameisen entweicht Ameisensäure. </div> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507364#m1507364 Der Martin self@kennst.net 2011-05-07T21:15:24Z 2011-05-07T21:15:24Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Hallo,</p> <blockquote> <p>Nur schade, dass die in der Adressleiste des Browsers angegebene URL nicht im Quelltext geschrieben steht, noch nicht mal relativ.</p> </blockquote> <p>wozu auch? Normalerweise ist die URL eines Web-Dokuments eine bekannte Größe. Wenn du das Dokument natürlich aus seinem Kontext herauslösen und isolieren willst, musst du diese Information zusätzlich speichern.</p> <blockquote> <p>Weil aber nicht bei allen Webseiten die angeforderte URL identisch mit der in der Adressleiste erscheinenden ist</p> </blockquote> <p>Doch, selbstverständlich. Abgesehen von Framesets, aber sobald du die Frames in eigenständigen Browserfenstern (Tabs) öffnest, gilt die Gesetzmäßigkeit wieder: In der Adressleiste steht genau die URL, unter der das Dokument angefordert wurde.</p> <blockquote> <p>Oder es hätte jemand einen Tipp, wie man den Browser so umschalten kann, dass er diese URL irgendwo in den Quelltext mit hinein schreibt.</p> </blockquote> <p>Zumindest der IE erzeugt beim Speichern einer Webseite einen HTML-Kommentar am Anfang des Dokuments, in dem die URL vermerkt ist, von der das Dokument gespeichert ist. Das ist aber nur ein schwacher Trost für die ansonsten schwere Verstümmelung des Quellcodes durch den IE.<br> Ansonsten bietet es sich an, beim Speichern einer Ressource deren URL im Datei- oder Verzeichznisnamen abzubilden.</p> <blockquote> <p>Denn so ein Quelltext besteht ja aus schier beinahe unendlich vielen Meta-Angaben</p> </blockquote> <p>Ach? Was für Quelltexte guckst du dir an?</p> <blockquote> <p>sodass der eigentliche Inhalt im Body dann geradezu untergeht unter diesen vielen Meta-Infos.</p> </blockquote> <p>Soso. Das ist mir bisher nicht untergekommen.</p> <blockquote> <p>Ich vermute, dass dies sogar Absicht ist, dass man wahnsinnig werden soll, falls man sich mal einen Quelltext vorknüpft. Und dass man dann möglichst auch noch an einem Wutanfall zugrunde gehen soll; wenn man dann nämlich auch noch bemerkt, dass kein einziger dieser Metas das Wichtigste verrät, was die jeweilige Seite betrifft, nämlich deren eigentliche URL.</p> </blockquote> <p>Natürlich. Und der Psychotherapeut wird vom Betreiber der Website gestellt.</p> <p>So long,<br>  Martin</p> <div class="signature">-- <br> Kopflosigkeit schützt nicht vor Migräne.<br> Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:( </div> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507367#m1507367 hotti http://rolfrost.de 2011-05-07T19:55:07Z 2011-05-07T19:55:07Z Ursprüngliche URL jeder Webseite des www anzeigen <blockquote> <p>Auf welche dieser beiden URLs müssen sich nun die relativen Linkangaben beziehen?</p> </blockquote> <p>auf Path</p> <p>http://forumtreff.pytalhost.de/viewtopic.php?t=406#t<br>                                                    ^Fragment<br>                                              ^Query_String<br>                               ^Path<br>        ^Auth<br> ^Scheme</p> <p>Hotti</p> <div class="signature">-- <br> Beim Zerquetschen von Ameisen wird Ameisensäure freigestzt. </div> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507369#m1507369 forumleaks dieweltist@yahoo.de http://forumtreff.pytalhost.de/i 2011-05-07T19:56:20Z 2011-05-07T19:56:20Z Ursprüngliche URL jeder Webseite des www anzeigen <blockquote> <p>Zu Deiner Frage zu Relativen Pfadangaben in action, href, scr...</p> <p>Diese sind immer relativ zum REQUEST_URI, also zu dem URI, der letztendlich in der Adresszeile des Browsers steht.</p> </blockquote> <p>Danke für diese klare Antwort. Übrigens hatte ich auch hier nachgefragt: <a href="http://4seven.kilu.de/forum/phpbb3/viewtopic.php?p=2055#p2055" rel="nofollow noopener noreferrer">Klick!</a></p> <p>Auch funktionieren LInks mit Sprungmarke hier in diesem Forum nur, wenn man %23 durch # manuell ersetzt; also die atomatische Ersetzung rückgängig macht.</p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507370#m1507370 hotti http://rolfrost.de 2011-05-07T20:05:49Z 2011-05-07T20:05:49Z Ursprüngliche URL jeder Webseite des www anzeigen <p>hi,</p> <blockquote> <p>Auch funktionieren LInks mit Sprungmarke hier in diesem Forum nur, wenn man %23 durch # manuell ersetzt; also die atomatische Ersetzung rückgängig macht.</p> </blockquote> <p>Aufpassen: Das Percent-Coding(Escape) # => %23 ist in dem Fall notwendig, wenn das Zeichen '#' in einer Komponente des Query_String als Parameter vorkommt.</p> <p>z.B. /foo/bar?rautenzeichen=%23#anker1</p> <p>Ohne Escape wird mit '#' ein Fragment eingeleitet.</p> <p>Hotti</p> <div class="signature">-- <br> Mist, ich brauche Relative Pfadangaben. Wo ich die doch gar nicht leiden kann!<br> </div> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507372#m1507372 Tom bitworks@web.de http://selfhtml.bitworks.de 2011-05-08T07:56:56Z 2011-05-08T07:56:56Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Hello,</p> <p>BTW:</p> <p>ich finde das Thema ganz interessant für den Fall, dass man eine Webseitengruppe offline verfügbar machen will. Welche URLs muss man da wie umwandeln in den Dokumenten, damit das Gesamtangebot noch funktioniert?</p> <p>Aufruf-URL: Domain in Pfadangabe im Dateisystem umwandeln;<br>   Pfadangabe: ?<br>   Aufrufparameter: ? soll man die Parameter anhängen lassen?</p> <p>URLs im Dokument:<br>   Images: ?<br>   Script-Ressourcen: ?</p> <p>absolute Pfad-Angaben (ohne Scheme und Domain)<br>   in relative umwandeln, signierte Elemente in den Pfaden ebenfalls herunterladen</p> <p>absolute URL-Angaben mit Scheme<br>   zur aufgerufenen URL: in relative umwandeln<br>   zu weiteren URLs: ? (stehen lassen, wenn nicht mit heruntergeladen?)</p> <p>...</p> <p>usw.</p> <p>Gibt es für diese Aufgabenstellung irgendwo schon ein schlaues Dossier?</p> <p>Liebe Grüße aus dem schönen Oberharz</p> <p>Tom vom Berg<br> <img src="http://selfhtml.bitworks.de/Virencheck.gif" alt="" loading="lazy"></p> <div class="signature">-- <br>  ☻_<br> /▌<br> / \ Nur selber lernen macht schlau<br> <a href="http://bergpost.annerschbarrich.de" rel="nofollow noopener noreferrer">http://bergpost.annerschbarrich.de</a> </div> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507374#m1507374 dedlfix 2011-05-08T08:21:32Z 2011-05-08T08:21:32Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Hi!</p> <blockquote> <p>[...] für den Fall, dass man eine Webseitengruppe offline verfügbar machen will. Welche URLs muss man da wie umwandeln in den Dokumenten, damit das Gesamtangebot noch funktioniert?</p> </blockquote> <p>Alles was nicht relativ zur aktuellen Seite angegeben ist. Das beinhaltet Angaben relativ zum DocumentRoot (also mit / beginnend)  und solche, die mit vollständiger URL angegeben sind, aber eigentlich hätten relativ notiert werden können. Weiterhin sind Directory-Indexe zu beachten, also alles was auf / endet (und theoretisch enden müsste, damit es keinen Redirekt auf .../ gibt) benötigt einen Dateinamen. Und Datei-Endungen wären auch interessant, die lässt man ja modernerweise gern weg.</p> <p>Falls es einem der Mitlesenden nicht klar ist: Das Problem ist, dass das gespeicherte Angebot in irgendeinem Unterverzeichnis abgelegt wird und damit nicht mehr relativ zum Wurzelverzeichnis (entspricht DocumentRoot auf dem Webserver) verlinkt werden kann.</p> <blockquote> <p>Aufruf-URL: Domain in Pfadangabe im Dateisystem umwandeln;<br>   Pfadangabe: ?<br>   Aufrufparameter: ? soll man die Parameter anhängen lassen?</p> </blockquote> <p>Wofür? Wenn du für jede Parameterkombination eine eigene Seite speicherst, weil sich der Inhalt entsprechend ändert, dann brauchst du sie in irgendeiner Form. Sonst nicht.</p> <blockquote> <p>URLs im Dokument:<br>   Images: ?<br>   Script-Ressourcen: ?</p> </blockquote> <p>Müssen relativ zum aktuellen Dokument angegeben sein.</p> <blockquote> <p>absolute Pfad-Angaben (ohne Scheme und Domain)<br>   in relative umwandeln, signierte Elemente in den Pfaden ebenfalls herunterladen</p> </blockquote> <p>Was sind signierte Elemente im Pfad?</p> <blockquote> <p>absolute URL-Angaben mit Scheme<br>   zur aufgerufenen URL: in relative umwandeln<br>   zu weiteren URLs: ? (stehen lassen, wenn nicht mit heruntergeladen?)</p> </blockquote> <p>Ja.</p> <p>Ich bin mir sicher, dass es Downloader gibt, die das alles gleich entsprechend anpassen.</p> <p>Lo!</p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507373#m1507373 hotti http://rolfrost.de 2011-05-08T14:25:30Z 2011-05-08T14:25:30Z Konsistente Verlinkung <p>hello,</p> <blockquote> <p>Gibt es für diese Aufgabenstellung irgendwo schon ein schlaues Dossier?</p> </blockquote> <p>Ja, gibt es, nennt sich Projektverwaltung. Idealerweise in elektronischer Form, so dass ein Programm darauf aufsetzen kann, was die Verlinkung erledigt.</p> <p>Hotti</p> https://forum.selfhtml.org/self/2011/may/7/urspruengliche-url-jeder-webseite-des-www-anzeigen/1507375#m1507375 Tom bitworks@web.de http://selfhtml.bitworks.de 2011-05-08T08:35:32Z 2011-05-08T08:35:32Z Ursprüngliche URL jeder Webseite des www anzeigen <p>Hello,</p> <blockquote> <blockquote> <p>Aufruf-URL: Domain in Pfadangabe im Dateisystem umwandeln;<br>   Pfadangabe: ?<br>   Aufrufparameter: ? soll man die Parameter anhängen lassen?</p> </blockquote> <p>Wofür? Wenn du für jede Parameterkombination eine eigene Seite speicherst, weil sich der Inhalt entsprechend ändert, dann brauchst du sie in irgendeiner Form. Sonst nicht.</p> </blockquote> <p>Die Parameter könnten auch durch JavaScript ausgewertet werden, also lokal.</p> <blockquote> <blockquote> <p>URLs im Dokument:<br>   Images: ?<br>   Script-Ressourcen: ?</p> </blockquote> <p>Müssen relativ zum aktuellen Dokument angegeben sein.</p> <blockquote> <p>absolute Pfad-Angaben (ohne Scheme und Domain)<br>   in relative umwandeln, signierte Elemente in den Pfaden ebenfalls herunterladen</p> </blockquote> <p>Was sind signierte Elemente im Pfad?</p> </blockquote> <p>namentlich genannt, also z.B. die Bilder und Scripte</p> <blockquote> <blockquote> <p>absolute URL-Angaben mit Scheme<br>   zur aufgerufenen URL: in relative umwandeln<br>   zu weiteren URLs: ? (stehen lassen, wenn nicht mit heruntergeladen?)</p> </blockquote> <p>Ja.</p> <p>Ich bin mir sicher, dass es Downloader gibt, die das alles gleich entsprechend anpassen.</p> </blockquote> <p>Da bin ich mir auch sicher. Nur finde ich es eben interessant, WAS die alles zu tun haben.</p> <p>Liebe Grüße aus dem schönen Oberharz</p> <p>Tom vom Berg<br> <img src="http://selfhtml.bitworks.de/Virencheck.gif" alt="" loading="lazy"></p> <div class="signature">-- <br>  ☻_<br> /▌<br> / \ Nur selber lernen macht schlau<br> <a href="http://bergpost.annerschbarrich.de" rel="nofollow noopener noreferrer">http://bergpost.annerschbarrich.de</a> </div>