Hans: WebsiteCounter (Prof.)

Hallo,

Ich habe einen Website-Counter gebastelt auf MySQL Basis.
Geloggt wird IP, Agent und TS.
Nun mal ein kleiner Auszug aus der Spalte Agent:

Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Crazy Browser 1.0.5; .NET CLR 1.1.4322)
Mozilla/5.0 (Windows; U; Windows NT 5.1; de-DE; rv:1.7.12) Gecko/20050919 Firefox/1.0.7
Mozilla/4.0 (compatible; MSIE 6.0; AOL 9.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)

Ich möchte aus diesen Daten nun eine anschauliche Tabelle machen.
Irgendwie komm ich aber nicht ganz damit zurecht und da bestimmt jemand hier im Forum schonmal das selbe Programmiert hat, wie ich nun vor habe, wird es nicht all zu schwer sein eine Lösung zu finden.

Welche Informationen gehen daraus hervor?
Und wie mache ich sie am Besten anschaulich?
Was ist denn ZB der Crazy Browser? Wieviele Browser gibt es denn?
Außerdem kommen in der DB ja auch Robots von Suchmachinen vor.

Würde mich sehr über eine Fertige Lösung freuen!

Danke.
Der Hans

  1. Hi,

    Ich habe einen Website-Counter gebastelt auf MySQL Basis.

    Und Dein privates Telephonbuch verwaltest Du dann mit Oracle?

    Geloggt wird IP, Agent und TS.

    Was ist 'TS'? "mit _T_omate und _S_alat"?

    Ich möchte aus diesen Daten nun eine anschauliche Tabelle machen.

    Was verstehst Du denn unter "anschaulich"?

    Welche Informationen gehen daraus hervor?

    Bis auf die IP: gar keine und die IP alleine ist auch von nur wenig Aussagekraft.

    Und wie mache ich sie am Besten anschaulich?

    In einer Tabelle? Mit (horizontalen) Balken für den Anteil?

    Was ist denn ZB der Crazy Browser?

    Das weiß normalerweise Google und wenn nicht ist das ein Beweis für die Unzuverlässigkeit des UA.

    Wieviele Browser gibt es denn?

    Ich schätze mal so über 40, wenn man etwas zusammenfaßt.
    Nimmt man es genau dürften es Hunderte werden.

    Außerdem kommen in der DB ja auch Robots von Suchmachinen vor.

    Ja, auch das sind Browser. Strenggenommen.

    Würde mich sehr über eine Fertige Lösung freuen!

    Das denke ich mir, das wirst Du aber hier nur sehr selten bekommen. Vor allem für so etwas.

    so short

    Christoph Zurnieden

    1. Hallo Christoph,

      Außerdem kommen in der DB ja auch Robots von Suchmachinen vor.

      Ja, auch das sind Browser. Strenggenommen.

      Naja, normalerweise ist beides jeweils eine Untermenge von HTTP-Client, wobei du natürlich Recht hast, dass es Überschneidungen und Unschärfen gibt.

      Unter Browser verstehe ich jedoch normalerweise ein Programm, das eine menschenlesbare Anzeige erzeugt, ein Robot/Crawler/Spider jedoch ist daran nicht primaer "interessiert".

      Grüße aus Barsinghausen,
      Fabian

      --
      "It's easier not to be wise" - < http://www.fabian-transchel.de/kultur/philosophie/ialone/>
  2. Hallo Hans,

    Ich möchte aus diesen Daten nun eine anschauliche Tabelle machen.
    Irgendwie komm ich aber nicht ganz damit zurecht und da bestimmt jemand hier im Forum schonmal das selbe Programmiert hat, wie ich nun vor habe, wird es nicht all zu schwer sein eine Lösung zu finden.

    Unter der Vorraussetzung, dass dein Script CLF-kompatible Logfiles schreibt, wäre hier eine schöne Lösung zur Auswertung:

    http://www.mrunix.net/webalizer/

    Was ist denn ZB der Crazy Browser? Wieviele Browser gibt es denn?
    Außerdem kommen in der DB ja auch Robots von Suchmachinen vor.

    Es gibt so viele "Browser" wie es User-Agent-Kennungen es gibt. Prinzipiell beliebig viele. Man kann bei der Auswertung lediglich Annahmen darüber treffen. So haben Opera-Browser normalerweise irgendwo im User-Agent-String das Wort "Opera" stehen. Firefoxes und Mozillas der neuesten Generation kann man eventuell an dem String "Gecko" erkennen. Aber diesen Text kann jeder ändern, für Firefox gibt es sogar eine Extension, die dies ermöglicht.

    Ich empfehle für den Anfang folgende Lektüre (wo wir schon mal auf SELFTHTML.org sind ;-)):

    http://de.selfhtml.org/diverses/clients.htm
    http://de.selfhtml.org/projekt/kontrollieren.htm

    MffG
    EisFuX

    --
    Erinnert mich ein Bisschen an die if-then-Schleifen von Java.
    (Alexandra Freund, IT-Compactkurs)
  3. hi!

    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Crazy Browser 1.0.5; .NET CLR 1.1.4322)
    Mozilla/5.0 (Windows; U; Windows NT 5.1; de-DE; rv:1.7.12) Gecko/20050919 Firefox/1.0.7
    Mozilla/4.0 (compatible; MSIE 6.0; AOL 9.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)

    Ich möchte aus diesen Daten nun eine anschauliche Tabelle machen.

    aja.

    Irgendwie komm ich aber nicht ganz damit zurecht und da bestimmt jemand hier im Forum schonmal das selbe Programmiert hat, wie ich nun vor habe, wird es nicht all zu schwer sein eine Lösung zu finden.

    Da müsstest du uns aber einmal sagen, was du denn genau vorhast, damit man sich darüber Gedanken machen kann.

    Welche Informationen gehen daraus hervor?

    Die verwendete Browser-engine.

    Und wie mache ich sie am Besten anschaulich?

    Was meinst du mit "anschaulich" genau? Ich meine, du kannst wie du vorher erwähnt hast alles in eine Tabelle packen, und das wars schon, aber...

    Was ist denn ZB der Crazy Browser? Wieviele Browser gibt es denn?

    Der Crazy-Browser ist eine "Art" Internetexplorer, eine Unterart von diesem, mit besseren Sicherheitsfeatures. Wie viele Browser es tatsächlich gibt, kann ich dir leider nicht sagen. Die bekanntesten wären zB Mozilla/Firefox, Opera, Konqeror (Linux), (InternetExplorer)

    Außerdem kommen in der DB ja auch Robots von Suchmachinen vor.

    wie jetzt?

    Würde mich sehr über eine Fertige Lösung freuen!

    (s.o)

    Danke.
    Der Hans

    lg
    azok

    --
    Murphys Law: "Alles Schöne im Leben ist entweder illegal, ungesetzlich oder es macht dick."
    Mein Selfcode: ie:% fl:( br:> va:) ls:& fo:) rl:( n4:° ss:) de:> js:| ch:? sh:) mo:) zu:)
    1. Hallo,

      Da müsstest du uns aber einmal sagen, was du denn genau vorhast, damit man sich darüber Gedanken machen kann.

      Genau.

      Welche Informationen gehen daraus hervor?
      Die verwendete Browser-engine.

      Bei diesen Beispielen schon. Verallgemeinern darf man diese Aussage aber nicht. Ich bin z.B. immer mit dem UA "Mozilla/4.0 (compatible; Generic Browser; Win32)" unterwegs. Und das ist meistens ein IE5.5/6.0, manchmal ein Firefox, selten ein Opera.

      Was ist denn ZB der Crazy Browser? Wieviele Browser gibt es denn?
      Der Crazy-Browser ist eine "Art" Internetexplorer, ...

      Der Crazy Browser ist eine Art Frontend für den Internet Explorer, ähnlich wie der Avant Browser. Das sind beides Programme, die ein "neues" GUI realisieren und hinter den Kulissen die MSIE-Engine verwenden.

      Außerdem kommen in der DB ja auch Robots von Suchmachinen vor.
      wie jetzt?

      Klar, und die sind manchmal nur schwer von "echten" Browsern zu unterscheiden.

      Würde mich sehr über eine Fertige Lösung freuen!

      Das gibt's hier normalerweise nicht. SELF ist Trumpf. Hilfestellung dazu gibt's natürlich gern.

      So long,

      Martin

  4. Hello,

    Würde mich sehr über eine Fertige Lösung freuen!

    Meinst Du nun nur die Aufteilung der Spalte "User-Agent"?

    Dafür gibt es wohl keine einheitliche Auswertung, da man in den Request schließlich reinschreiben kann, was man will bei UserAgent und Referrer.

    Du könntest bei UA bestenfalls eine Auswertung/Auslösung nach bekannten Schlüsselworten durchführen und alle nicht vollständig auflösbaren dann auf den "Handtrainingsplatz" weiterleiten. Viel Spaß beim Sprüche zählen. Ich habe häufiger ganze "Gagmeldungen" von meinen Kumpels in den Logs stehen, nur um zu testen, ob ich die auch regelmäßig ansehe ;-))

    Harzliche Grüße vom Berg
    esst mehr http://www.harte-harzer.de

    Tom

    --
    Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
    Nur selber lernen macht schlau
  5. Moin moin,

    Welche Informationen gehen daraus hervor?
    Und wie mache ich sie am Besten anschaulich?

    für meine Zwecke habe ich mir auch sowas gebastelt, z. B.: http://www.joerglorenz.de/statistik.php.

    Im Prinzip hole ich mir die Angaben, die ich brauche, aus der MySQL-Tabelle und lasse einfach die Zeichenfolgen, die relevant sind, zählen. Mehr ist das nicht.

    Allerdings habe ich das nuur gemacht, um punktuell bestimmte Aktionen verfolgen zu können. Wissen muß man auch, daß diese Statistik nur grobe Anhaltspunkte liefert. Eine richtige Logfileauswertung (Link ist irgendwo in diesem Thread) kann es nicht ersetzen.

    Ach so: Damit meine Aufrufe nicht gezählt werden, habe ich meinem Browser einen anderen UA verpaßt, damit der gar nicht erst erfaßt wird.

    Außerdem kommen in der DB ja auch Robots von Suchmachinen vor.

    Ja, das ist bei meiner Auswertung auch nur unzureichend berücksichtigt. Bots werden zwar berücksichtigt, aber nicht Spider usw. Wenn ich Zeit habe, baue ich das mal mit ein.

    Würde mich sehr über eine Fertige Lösung freuen!

    Naja, kann es bei der Vorgehensweise überhaupt eine fertige Lösung geben? Das hängt doch von mehreren Faktoren ab, z. B. wie Du die Daten speicherst und was Du bei der Auswertung primär benötigst.

    Viele Grüße

    Jörg