Robert Bienert: Webserverstatistikauswertung - besseres als webalizer gesucht

Beitrag lesen

Moin Robert,

Moin!

hm - aja. Also bist du so etwa ... 30 Jahre alt?

Nein, so gut wie 21, hab letztes Jahr Abi gemacht und werde ab Oktober die Uni unsicher machen.

Das mit dem image "Tag" muss ich mir merken.

Mehr oder weniger Tag. eigentlich eher Forensystem - CK's Classic-Forum-Syntax.

Aha.

...
[iframe:IFRAME]

iframe? Das ist doch u.U. gefährlich (siehe http://www.heise.de/security/dienste/browsercheck/demos/ie/frame.shtml).

da gibt's afaik noch einen mehr, schau dazu mal in die Signatur von CK (momentan "broken", da seine homepage irgendein problem hat oder sowas)

Mir reichen die beiden link und image vollkommen aus. Man ist ja schließlich ASCII-(Art-)Purist ;-)

Glücklicherweise gibt es ja jetzt (seit 1998) gewisse Webstandards, die Homepage-"Bastlern" als auch Surfern das Leben einfacher machen (sollen).

genau. War aber bereits vor meiner Zeit, 1998.

Wie alt bist du dann, wenn man fragen darf, oder meinst du deine "aktive Internetzeit"?

[...] Aber ist gibt mittlerweile (rechtlich) verbindliche Richtlinien, wie ein Impressum auszusehen hat (privat oder geschäftlich), die die ganze Sache erheblich vereinfachen.

hm - das ändert nichts an dieser allgemein vorherrschende Impressums-Unwissenheit.

Leider. Man sollte den Inhalt den man im Internet veröffentlich, den gleichen Maßstäben unterziehen, wie man es im Alltag auch tut (Bücher  herausbringen, Leserbriefe schreiben, zwischenmenschliche Kommunikation, ...). Aber dieses Bewusstsein fehlt vielen.

Cookies lassen sich deaktivieren, das "Referer-Verraten" des Browsers auch. Bei Mozilla afaik zumindest.

Wer macht das schon? Du und ich, aber doch nicht der 08/15-DAU, der froh darüber ist, dass sein XP endlich mal wieder länger als 2 Minuten im Internet ist, nachdem "ein guter Freund" da irgend etwas gegen nen Virus installiert hat.

Dafür reicht die simple Speicherung der Browserkennung, die Apache-Standardeinstellung geht aber weit darüber hinaus.

Es gibt (apache-)Standartpattern für Logfiles. Z.B. combined. Das ist die einzige, wo der http-user-agent gespeichert wird, und die mein logfileprogramm gespeichert hat.

Ich meinte, dass diese Pattern noch viel mehr als nur die Browserkennung speichern.

Solche Daten sind doch höchstens interessant, wenn es darum geht den Webserver zu tunen bzw. fürs Loadbalancing.

überhaupt nicht. Z.B. zeigt mir meine Jahresübersicht, dass im Januar extrem viel hits waren (etwa 45.000), im Laufe der Monate ist es immer, immer weiter runtergegangen, diesen Monat habe ich erst (etwa) 3.500 Hits verzeichnet. Sowas könnte ich sonst nie bemerken.

Und, was kann ich jetzt als Server-Betreiber mit dieser Information anfangen? Schlechtes Marketing?

Der Grund für diesen Rückgang ist außerdem, dass der server fast nie an war in den letzten Monaten, weil ich so vielbeschäftigt war.

Für diese Erkenntnis brauche _ich_ keine Logfiles ;-)

Trotzdem war das letzte halbe Jahr irgendwie bescheuert. Ich befürchte, dass ich nächtes Jahr noch weniger Zeit für sowas hier haben werde. Tja, die Pflichten rufen!

Jaja, der Alltag, da kann man nicht einfach mal ESC für Pause drücken (das musste der Nerd in mir grad mal loswerden ;-) )

g) ... und wo sie wieder aussteigen

= was sie am wenigsten interessiert hat (z.b.)

Wow, solche Gedanken mache ich mir gar nicht, ich denke mir, entweder wollen die Leute meinen Kram lesen oder nicht. Vielleicht bin ich da zu sehr Verfechter der Linie "auf den Inhalt kommt es an".

Aber damit kann man in der Tat z.B. auch (versuchte) DDoS-Attacken erkennen, wenn z.B. nur die /index.html nachgefragt wird, aber keine damit verlinkten Stylesheets, Grafiken, ...

theoretisch schon. Obwohl dann "telnet meinserver on Port 80 und enter GET /" auch als Dos-Attacke zu bewerten sein könnte.

Wenn man das von vielen Clients aus in sehr kurzer Zeit macht, kann das schon den Server nach unten ziehen, ich würde dafür aber nicht telnet nehmen, sondern was Automatisches.

Was sollte eigentlich eine DOS-Attacke auf den armen kleinen apachen bringen?

Frag mal den Betreiber von http://www.fourmilab.ch/.

das problem bei mir ist, dass mein accesslog bereits so gigantisch groß ist - hmmmm... knapp 30MB sind das inzwischen.

Wieso löscht du nicht die alten Daten (und behälst nur die ausgewertete Statistik) oder schmeißt weniger relevante Einträge heraus? Weiterhin kann der Apache (oder zumindest das Unix dahinter) automatisch (z.B. jeden Monat) die Logfiles rotieren, dann hast du zwar mehr davon, aber kleinere.

Gruß,

Sven

Robert