Patrick Andrieu: Danke, im grossen und ganzen erstmal geklärt

Beitrag lesen

Hallo Engin!

Ich hab den ganzen Tag verschlafen.

Arbeitest Du derzeit nachts?

Das ist mir aber auch schon zuviel
aber die access.logs haben es in sich

Ach iwo. Wenn man weiß, wie sie aufgebaut sind, kann man vieles herauslesen. Und stellt zum Beispiel fest, dass die Suche nach allen IEs ein kleineres Ergebnis auswirft als die Summe aller Einzelversionen des IEs, bis man dann so einen gefakten User-Agent entdeckt:

"GET /cgi-bin/guest/guest.pl HTTP/1.1" 200 15575 old.atomic-eggs.com "-" "User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) ; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.2)"

Tja, mein Perl-Skript hat ihn einmal als IE 7 und noch einmal als IE 6 gezählt. Und? Wo soll ich ihn jetzt einordnen? So würde es normalerweise aussehen:

"GET /cgi-bin/guest/guest.pl HTTP/1.1" 200 15575 old.atomic-eggs.com "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"

Interessant ist es auch, sich nur die Zeilen ausgeben zu lassen, die einen POST-Request protokollieren. Beispiel:

83.222.23.200 - - [05/Oct/2007:08:46:00 +0200] "POST /cgi-bin/html_log.cgi HTTP/1.1" 200 51593 old.atomic-eggs.com "http://google.com" "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)" "-"
83.222.23.200 - - [05/Oct/2007:08:46:04 +0200] "POST /cgi-bin/guest/guest.pl HTTP/1.1" 200 15519 old.atomic-eggs.com "http://google.com" "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)" "-"

Ein dummer Spammer: So schnell kann kein normaler User von meiner Statistkiseite html_log.cgi zum alten, nuschelweichen Gästebuch guest.pl wechseln. Außerdem: Ein POST-Request mit als Referrer google.com? Schön, dass Google Formulare für meine Gästebücher bereitstellt ;)

Hab die mal Hochgeladen, http://nimmet.de/meinelogs.
(das sind die logs von klic*andsur*

Ja, das sind aber keine Logs, sondern Traffic-Stats, die aus den Logs gewonnen werden (klickand* hat bedeutend mehr Traffic als meine derzeit 4 Domains zusammen...). BTW: ich habe dadurch festgestellt, dass mein Perl-Skript zum Zusammenfügen der Wochenlogs zu Monatslogs gut gearbeitet hat: Für September unter HTTP-Zugriffe steht: 269969 - das ist genau die Anzeil der Zeilen der vom Skript erstellten September.txt :)

Diese logs sind auch in meinem Paket, das meinerseits auswerten zu können wird aber wohl noch
ein bisschen dauern, aber ich bleib dran.  ;)

Die werte ich nicht aus, ich schau mir regelmäßig die mail.log an, um zu überprüfen, dass die Anzahl der dort protokollierten Mailsendungen nicht die Anzahl der Mails überschreitet, die ich bekommen habe. Wäre es so, hätte ich ein Problem ;)

Da hast du bedeutend mehr als ich, liegt aber an deinem Paket, ich
hab nur ein Basic-Paket wo nur ftp.log mail.log und die access.logs vorhanden sind.

Dir fehlen aber nur die Info-Skripte, wenn ich das richtig verstehe? Die gezippten Wochenlogs (*.gz) hast Du aber doch auch, oder?

Ja. ;) Verstehe zwar, was du meinst, verstehe allerdings nichts von Perl, Python, PHP. :(

Bei Python und PHP muss ich auch passen. Perl interessiert einfach mehr. Kannst Du eigene Perl-Skripte laufen lassen? Wenn ja, hätte ich ein kleines Auswertungsskript für Dich, das die täglichen Zugriffe nach IP gruppiert. So läßt sich verfolgen, was ein User sich alles anschaut. Und wer spamt oder wer es versucht ;) Die erste Seite die ich morgens aufrufe, und die letzte vor Mitternacht!

Viele Grüße aus Frankfurt/Main,
Patrick

--

_ - jenseits vom delirium - _
[link:hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash]
Nichts ist unmöglich? Doch!
Heute schon gegökt?