Jörg Reinholz: crawler für Dokumente auf einer Webseite

Beitrag lesen

Funktioniert bei dir diesen Aufruf:
wget -r --spider http://www.klinikamrosengarten.de/ 2>&1

Ja.

Arbeitest du auch mit Linux? Wie verändere ich meine Einstellungen für wgetrc?

Da gibt es zwei Möglichkeiten:

/etc/wgetrc (Nur Mit root-Rechten zu bearbeiten, gilt für alle Benutzer, die es nicht "überladen")

oder

$HOME/.wgetrc (Lies: "PunktWgetrc")  im Heimatverzeichnis des Benutzers für den das gelten soll. Bearbeiten mit gültigen Benutzerrechten.

Nimm den Editor Deiner Wahl. Im Übrigen hätte man wget auch weiter geholfen, das liefert ganz unten:

  
FILES  
       /etc/wgetrc  
           Default location of the global startup file.  
  
       .wgetrc  
           User startup file.  

aber nicht diese kleine, toll funktionierende Erweiterung: Setzt man mit

  
~ export WGETRC=/tmp/tolleDatei  

dann muss oder kann /tmp/tolleDatei bearbeitet werden, Die ~/.getrc wird dann nicht mehr beachtet. Das wüsstest Du aber wenn Du daran gefummelt hättest. Beachte das also nicht weiter.

Jörg Reinholz