Frank P.: wget + md5 (o.ä.)

Hi,

ich habe eine Frage zu Wget, zu der ich leider keine Antwort in der Dokumentation finden kann.
Wie verhält sich wget, wenn ich Seiten holen, die dyn. generiert werden (somit kein timestamping möglich ist) und z.B. SessionIDs verlinkt sind.

Der Hintergrund ist, daß ich es erreichen möchte, mich nicht im Kreis zu bewegen. Ist sowas wie md5-checksum in wget implementiert, so daß das Gerät selbständig eine Gleichheit erkennt?

Danke!

Gruß
Frank

  1. Moin!

    ich habe eine Frage zu Wget, zu der ich leider keine Antwort in der Dokumentation finden kann.
    Wie verhält sich wget, wenn ich Seiten holen, die dyn. generiert werden (somit kein timestamping möglich ist) und z.B. SessionIDs verlinkt sind.

    Ich würde sagen, genauso wie jeder andere Spider, der eine Website abgrast: Jeder Link wird verfolgt, und wenn die URL nicht mit einer vorherigen URL identisch ist, wird die Seite abgerufen.

    Der Hintergrund ist, daß ich es erreichen möchte, mich nicht im Kreis zu bewegen. Ist sowas wie md5-checksum in wget implementiert, so daß das Gerät selbständig eine Gleichheit erkennt?

    Wieso sollte zwei Seiten gleich sein, wenn sie unterschiedliche URLs haben? Ich meine, auch wenn sie inhaltlich gleich sind, ist die Tatsache, dass die URLs unterschiedlich sind, doch eindeutige Tatsache, dass die Seiten NICHT gleich sind.

    - Sven Rautenberg

    --
    "Habe den Mut, dich deines eigenen Verstandes zu bedienen!" (Immanuel Kant)