Patrick Andrieu: Bekloppte User Agents zuordnen (RegExp)

Beitrag lesen

Hallo Engin!

atomic-eggs.com  -  Anzahl aller Hits: 293478
4 Domains von mir - Anzahl aller Hits: 1877781

Da ist ja ein Unterschied bemerkbar, aber

atomic-eggs.com  -  Anzahl aller PageViews: 71330
4 Domains von mir - Anzahl aller PageViews: 108868

Hier läuft irgendwas verkehrt, ich gehe aber mal davon aus, das es an mir liegt und nicht am Script. :)

Meinst Du damit, dass Du sechs mal mehr Hits hast als ich? Nun ja, die Clubseiten und klickand* machen ja schon allerhand.

Oder meinst Du den Unterschied zwischen »alle Hits« und PageViews? Der ist normal, schau mal. Bei jedem Request einer Seite werden Bilder, css-Dateien, js-Dateien womöglich auch, und und und: allein der Aufruf einer einzigen Seite erzeugt bei mir 23 Log-Einträge:

GET /wae/wae_0.shtml HTTP/1.0" 200 13173 www.atomic-eggs
GET /files/haupt.css HTTP/1.0" 304 - www.atomic-eggs.com
GET /files/haupt.js HTTP/1.0" 304 - www.atomic-eggs.com
GET /files/font.js HTTP/1.0" 304 - www.atomic-eggs.com "
GET /pics/open_wae.gif HTTP/1.0" 304 - www.atomic-eggs.c
GET /pics/logo.gif HTTP/1.0" 304 - www.atomic-eggs.com "
GET /pics/nav_cwi.gif HTTP/1.0" 304 - www.atomic-eggs.co
GET /pics/atomicegg.gif HTTP/1.0" 304 - www.atomic-eggs.
GET /pics/nav_scr.gif HTTP/1.0" 304 - www.atomic-eggs.co
GET /pics/help.gif HTTP/1.0" 304 - www.atomic-eggs.com "
GET /pics/nav_oae.gif HTTP/1.0" 304 - www.atomic-eggs.co
GET /pics/nav_ssp.gif HTTP/1.0" 304 - www.atomic-eggs.co
GET /pics/yellow.gif HTTP/1.0" 304 - www.atomic-eggs.com
GET /pics/print.gif HTTP/1.0" 304 - www.atomic-eggs.com
GET /pics/search.gif HTTP/1.0" 304 - www.atomic-eggs.com
GET /pics/blue.gif HTTP/1.0" 304 - www.atomic-eggs.com "
GET /pics/down.gif HTTP/1.0" 304 - www.atomic-eggs.com "
GET /pics/red.gif HTTP/1.0" 304 - www.atomic-eggs.com "h
GET /pics/green.gif HTTP/1.0" 304 - www.atomic-eggs.com
GET /pics/rahmenmitte.gif HTTP/1.0" 304 - www.atomic-egg
GET /pics/rahmenunten.gif HTTP/1.0" 304 - www.atomic-egg
GET /pics/rahmenoben.gif HTTP/1.0" 304 - www.atomic-eggs
GET /favicon.ico HTTP/1.0" 200 3126 www.atomic-eggs.com

Bei der Auswertung nach PageViews werden alle die Zeile ignoriert:

#### Browserauswertung nach PageViews ####
  if ($html) {
    next if /((counter.cgi.+)|(.exe|.zip|.class|.au|/skype|ico|gif|css|js|jpg|robots.txt|png|cfg|/logs/?)).*\s*HTTP/1/i;
    next if m{GET /\S*/*\S*/*?[a-z]=[a-z] HTTP/1.\d}i;
    $pagecount++;
    $count = $pagecount;
  }
  ##########################################

OK, »counter.cgi« und /skype ist spezifisch für meine Webseite, kann man aber im RegExp lassen, aber wer es will, kann es ja 'rausnehmen. Hier siehst Du, was alles ignoriert wird: alle Requests auf files mit den obigen Endungen. BTW werde ich die RegExps alle mal verfeinern, nur die nächste Zeit läuft da nicht viel mit proggen (Besuch der alten Dame *g*).

Viele Grüße aus Frankfurt/Main,
Patrick

--

_ - jenseits vom delirium - _
[link:hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash]
Nichts ist unmöglich? Doch!
Heute schon gegökt?
0 79

Bekloppte User Agents zuordnen (RegExp)

Patrick Andrieu
  • programmiertechnik
  1. 0
    Cheatah
    1. 2

      UA-Statistiken fälschen

      Siechfred
      • perl
      1. 0
        Patrick Andrieu
        1. 1
          Siechfred
          1. 0

            Die erfolgreiche Fälschung

            Patrick Andrieu
            1. 1

              Das Modul zur erfolgreichen Fälschung?

              Siechfred
              1. 0
                Patrick Andrieu
                1. 0
                  Siechfred
              2. 0
                Siechfred
              3. 0
                Patrick Andrieu
                1. 0
                  Siechfred
                  1. 0
                    Patrick Andrieu
                    1. 0
                      Siechfred
                      1. 0
                        Patrick Andrieu
                        1. 0
                          Siechfred
                          1. 0
                            Patrick Andrieu
                            1. 0
                              Siechfred
                              1. 0
                                Patrick Andrieu
                                1. 0
                                  Patrick Andrieu
                                  1. 0
                                    Siechfred
                                    1. 0
                                      Patrick Andrieu
                                      1. 0
                                        Siechfred
                                        1. 0
                                          Patrick Andrieu
                                          1. 0
                                            Patrick Andrieu
                                          2. 0
                                            Siechfred
                                2. 0
                                  Siechfred
            2. 0

              Die erfolgreichen Statmaker- und -fälscher-Skripts für 1&1-User!

              Patrick Andrieu
              1. 0
                Patrick Andrieu
                1. 0
                  Struppi
                  1. 0
                    Patrick Andrieu
    2. 0
      Patrick Andrieu
      1. 0
        Cheatah
        1. 0
          Patrick Andrieu
  2. 0
    Don P
    1. 0
      Don P
    2. 0
      Patrick Andrieu
      1. 0
        Don P
        1. 0
          Patrick Andrieu
          1. 0
            Don P
            1. 0
              Patrick Andrieu
      2. 0

        Logline splitter (RegExp)

        Patrick Andrieu
  3. 2
    Struppi
    1. 0
      Patrick Andrieu
      1. 0
        Patrick Andrieu
  4. 0
    Der Martin
    1. 0
      Alexander (HH)
    2. 0
      Patrick Andrieu
      1. 0
        Der Martin
        1. 0
          Cheatah
          1. 0
            Patrick Andrieu
            1. 0
              Cheatah
        2. 0
          Patrick Andrieu
          1. 0
            Der Martin
            1. 0

              RegExp'sch ist gar nicht so schwer :)

              Siechfred
              • menschelei
    3. 0
      Patrick Andrieu
      1. 0
        Der Martin
        1. 0
          Patrick Andrieu
          1. 0
            Patrick Andrieu
            1. 0
              Struppi
      2. 0
        Ingo Turski
        1. 0
          Patrick Andrieu
          1. 0
            Ingo Turski
            1. 0
              Patrick Andrieu
              1. 0
                Ingo Turski
                1. 0
                  Patrick Andrieu
                  1. 0
                    Engin
                  2. 0
                    Engin
                    1. 0
                      Patrick Andrieu
                      1. 0
                        Engin
                        1. 0
                          Patrick Andrieu
                          1. 0
                            Engin
                            1. 0
                              Patrick Andrieu
                              1. 0
                                Engin
                                1. 0
                                  Patrick Andrieu
                                  1. 0
                                    Engin
                  3. 0
                    Ingo Turski
                    1. 0
                      Patrick Andrieu
        2. 0
          Patrick Andrieu