dedlfix: Ursprüngliche URL jeder Webseite des www anzeigen

Beitrag lesen

Hi!

[...] für den Fall, dass man eine Webseitengruppe offline verfügbar machen will. Welche URLs muss man da wie umwandeln in den Dokumenten, damit das Gesamtangebot noch funktioniert?

Alles was nicht relativ zur aktuellen Seite angegeben ist. Das beinhaltet Angaben relativ zum DocumentRoot (also mit / beginnend)  und solche, die mit vollständiger URL angegeben sind, aber eigentlich hätten relativ notiert werden können. Weiterhin sind Directory-Indexe zu beachten, also alles was auf / endet (und theoretisch enden müsste, damit es keinen Redirekt auf .../ gibt) benötigt einen Dateinamen. Und Datei-Endungen wären auch interessant, die lässt man ja modernerweise gern weg.

Falls es einem der Mitlesenden nicht klar ist: Das Problem ist, dass das gespeicherte Angebot in irgendeinem Unterverzeichnis abgelegt wird und damit nicht mehr relativ zum Wurzelverzeichnis (entspricht DocumentRoot auf dem Webserver) verlinkt werden kann.

Aufruf-URL: Domain in Pfadangabe im Dateisystem umwandeln;
  Pfadangabe: ?
  Aufrufparameter: ? soll man die Parameter anhängen lassen?

Wofür? Wenn du für jede Parameterkombination eine eigene Seite speicherst, weil sich der Inhalt entsprechend ändert, dann brauchst du sie in irgendeiner Form. Sonst nicht.

URLs im Dokument:
  Images: ?
  Script-Ressourcen: ?

Müssen relativ zum aktuellen Dokument angegeben sein.

absolute Pfad-Angaben (ohne Scheme und Domain)
  in relative umwandeln, signierte Elemente in den Pfaden ebenfalls herunterladen

Was sind signierte Elemente im Pfad?

absolute URL-Angaben mit Scheme
  zur aufgerufenen URL: in relative umwandeln
  zu weiteren URLs: ? (stehen lassen, wenn nicht mit heruntergeladen?)

Ja.

Ich bin mir sicher, dass es Downloader gibt, die das alles gleich entsprechend anpassen.

Lo!