web.archive.org - robots.txt blockiert Zugriff, warum? von Phil, 12.01.2003 10:13

web.archive.org - robots.txt blockiert Zugriff, warum?

Phil Homepage des Autors 11.01.2003 23:16

projektverwaltung

Hi!
Wenn ich auf http://www.web.archive.org nach http://www.yubb.de suche, wird mir gesagt, dass die robots.txt den Zugriff verweigern würde. (http://www.yubb.de/robots.txt)

Nun wollte ich fragen, was ich falsch mache.
Wenn ihr was wisst, wärs nett, wenn ihr mir helfen könntet.
CU
http://www.yubb.de--
Probier mal was anderes diesen Winter: Coke bei 60 °

Beitrag melden

– Informationen zu den Bewertungsregeln

web.archive.org - robots.txt blockiert Zugriff, warum?
fastix Homepage des Autors 12.01.2003 00:41

projektverwaltung
– Informationen zu den Bewertungsregeln
http://www.yubb.de/robots.txt

User-agent: *
Disallow: /stats
Disallow: /mysqladmin
Disallow: /gb
Disallow: /forum/admin
Disallow: /usage

User-agent: WebZIP
Disallow: /

User-agent: ia_archiver
Disallow: /

Da steht WebZip und ia-archiver dürfen die Website nicht scannen. Also machen die das erfreulicherweise auch nicht.

Es ist alles richtig.

fastix
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. web.archive.org - robots.txt blockiert Zugriff, warum?
  
  Phil Homepage des Autors 12.01.2003 10:13
  
  projektverwaltung
  – Informationen zu den Bewertungsregeln
  Hi!
  Und was für einen User-Agent nutzt web.archive.org? Ich mein, wenn der da rumzickt?!
  CU
  http://www.yubb.de
  
  --
  Probier mal was anderes diesen Winter: Coke bei 60 °
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. web.archive.org - robots.txt blockiert Zugriff, warum?
    
    Sven Rautenberg Homepage des Autors 12.01.2003 10:28
    
    projektverwaltung
    
    – Informationen zu den Bewertungsregeln
    Moin!
    
    Und was für einen User-Agent nutzt web.archive.org? Ich mein, wenn der da rumzickt?!
    
    Mal schlau überlegen: web.archive.org nennt sich auch "Internet Archive Wayback Machine"
    
    Und wie könnte man dann den Archivier-Spider des "Internet Archive" wohl nennen? Na, kommst du selbst drauf?
    
    - Sven Rautenberg
    
    --
    "Bei einer Geschichte gibt es immer vier Seiten: Deine Seite, ihre Seite, die Wahrheit und das, was wirklich passiert ist." (Rousseau)
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
    1. web.archive.org - robots.txt blockiert Zugriff, warum?
      
      Phil Homepage des Autors 12.01.2003 13:54
      
      projektverwaltung
      
      – Informationen zu den Bewertungsregeln
      
      Hi!
      okok ;D
      CU
      http://www.yubb.de
      
      --
      Probier mal was anderes diesen Winter: Coke bei 60 °
      
      Beitrag melden
      
      –
      Informationen zu den Bewertungsregeln
      
      Übersicht
      
      alle Foren
      
      SELFHTML-Forum
      
      anmelden
      
      Benutzerkonto erstellen
      
      Beitrag im Thread-Baum
  2. web.archive.org - robots.txt blockiert Zugriff, warum?
    
    Michael Schröpl Homepage des Autors 13.01.2003 11:30
    
    projektverwaltung
    
    – Informationen zu den Bewertungsregeln
    Hi Phil,
    
    Und was für einen User-Agent nutzt web.archive.org? Ich mein, wenn der da rumzickt?!
    
    läßt Du solche Informationen etwa nicht von Deinem Webserver-Log erfassen?
    
    Viele Grüße
    Michael
    
    --
    T'Pol: I apologize if I acted inappropriately.
    V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Phil: web.archive.org - robots.txt blockiert Zugriff, warum?

web.archive.org - robots.txt blockiert Zugriff, warum?

web.archive.org - robots.txt blockiert Zugriff, warum?

web.archive.org - robots.txt blockiert Zugriff, warum?

web.archive.org - robots.txt blockiert Zugriff, warum?

web.archive.org - robots.txt blockiert Zugriff, warum?

web.archive.org - robots.txt blockiert Zugriff, warum?

web.archive.org - robots.txt blockiert Zugriff, warum?