Max Smily: Websitebesuche von Bots?

Hallo Forum,

Ich habe für meine PHP-Anwendungen (Shop und Newssystem) ein kleines Tracking-Tool erstellt. Alle GET- und POST-Eingaben während eines Besuches auf den Webseiten werden zusammen mit der Session-ID und der IP geloggt. So kann ich die Besucheranzahl (Sessions) und ihre Verlaufswege einsehen. Alles funktioniert wunderbar und wie gewünscht.

Jetzt stelle ich aber fest, dass meine Webseiten einen sehr starken Zulauf von "Ein-Klick-Besuchen" haben. Dass heißt, es gibt sehr viele Sessions mit einer _fast_ identischen IP, die nur einen einzigen "Klick" erzeugen. Und davon massenweise.

Gestern hatte ich 189 Besuche (Sessions), davon waren aber nur 51 "echte" Besucher.

Hier mal ein Ausschnitt aus meiner Log-Anzeige

Session      IP            Start                 Ende                  Dauer  Klicks
 1  5ef984f2...  64.71.144.21  01.10.2004, 23:56:44  01.10.2004, 23:56:44  1 sec  1
 2  c0d63566...  64.71.144.21  01.10.2004, 23:55:12  01.10.2004, 23:55:12  1 sec  1
 3  f6ba5dcc...  64.71.144.27  01.10.2004, 23:43:34  01.10.2004, 23:43:34  1 sec  1
 4  90a5e230...  80.133.76.115  01.10.2004, 23:43:19  01.10.2004, 23:51:52  8 min 33 sec  40
 5  e2e9330f...  64.71.144.27  01.10.2004, 23:41:45  01.10.2004, 23:41:45  1 sec  1
 6  16a06ebe...  64.71.144.75  01.10.2004, 23:40:15  01.10.2004, 23:40:15  1 sec  1
 7  59c1ca1a...  64.71.144.75  01.10.2004, 23:39:28  01.10.2004, 23:39:28  1 sec  1
 8  88865033...  64.71.144.31  01.10.2004, 23:27:34  01.10.2004, 23:27:34  1 sec  1
 9  ca98fc40...  217.84.142.5  01.10.2004, 23:26:47  01.10.2004, 23:33:02  6 min 15 sec  50
10  f43e4e1e...  64.71.144.31  01.10.2004, 23:25:36  01.10.2004, 23:25:36  1 sec  1
11  5e47c77e...  64.71.144.29  01.10.2004, 23:06:28  01.10.2004, 23:06:28  1 sec  1
12  ad8d4152...  64.71.144.29  01.10.2004, 23:04:50  01.10.2004, 23:04:50  1 sec  1
13  ea3d8ea5...  64.71.144.45  01.10.2004, 22:55:45  01.10.2004, 22:55:45  1 sec  1
14  601f8c7c...  80.138.82.34  01.10.2004, 22:18:29  01.10.2004, 22:18:40  11 sec  3

Dabei wird es sich wohl um irgend einen Bot handeln. Die Besuche erfolgen über den ganzen Tag hinweg in Abständen von ca. 10 bis 20 Minuten - immer ein Klick. Und dass über Tage hinweg.

Habt ihr eine Idee, um was es sich bei diesem Bot handeln könnte?
Sind das Suchmaschinen-Bots?
Ist es normal, dass Suchmaschinen einen Seite über Wochen im 10 Minuten-Takt indizieren?

Grüße
Max

  1. hallo,

    Habt ihr eine Idee, um was es sich bei diesem Bot handeln könnte?
    Sind das Suchmaschinen-Bots?

    Das ist durchaus möglich. Bei mir sieht das zum Vergleich so aus:
    66.196.90.159 - - [01/Oct/2004:13:37:04 +0200] "GET /robots.txt HTTP/1.0" 404 286 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
    66.196.90.220 - - [01/Oct/2004:13:37:05 +0200] "GET /archiv/32.htm HTTP/1.0" 304 - "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
    66.196.90.236 - - [01/Oct/2004:14:27:42 +0200] "GET /archiv/146.htm HTTP/1.0" 304 - "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"

    Ist es normal, dass Suchmaschinen einen Seite über Wochen im 10 Minuten-Takt indizieren?

    10-Minuten-Takt ist nicht so ganz normal, aber zweimal am Tag kann schon vorkommen.

    Grüße aus Berlin

    Christoph S.

  2. Hallo,

    dazu gibt es das schöne tool nslookup
    z.b:

    Name:    jeti.jeteye.com
    Address:  64.71.144.27
    Aliases:  27.144.71.64.in-addr.arpa

    Name:    jetk.jeteye.com
    Address:  64.71.144.31
    Aliases:  31.144.71.64.in-addr.arpa

    aha, http://jeteye.com
    ohhh http://jeteye.com/jetbot.html

    Bert

    --
    E492: Not an editor command: Wq
    ln -s /dev/brain