Patrick Andrieu: Bekloppte User Agents zuordnen (RegExp)

Beitrag lesen

Hallo Don P.!

Also muss man eigentlich nur sicherstellen, dass immer die erste Klammer im RegExp matcht, gefolgt von dem, was man sonst noch matchen will.

Das Problem ist aber, es sind komplette Zeilen der access-log-File. Deine RegExps:

Also:
             $allIE++ if (/[^(]+?(compatible; MSIE / && !/Opera/);
             $anzahlIE3++ if (/[^(]+?(compatible; MSIE 3/ && !/Opera/);
             $anzahlIE4++ if (/[^(]+?(compatible; MSIE 4/ && !/Opera/);
             $anzahlIE5++ if (/[^(]+?(compatible; MSIE 5/ && !/Opera/);
             $anzahlIE6++ if (/[^(]+?(compatible; MSIE 6/ && !/Opera/);
             $anzahlIE7++ if (/[^(]+?(compatible; MSIE 7/ && !/Opera/);

unterschlagen mir 12 IEs bei der Gessamtzählung ($allIE), und zwar aus solchen Zeilen:

217.6.15.133 - - [29/Oct/2007:11:05:17 +0100] "GET /1/rezept1.html HTTP/1.1" 200 5253 advent-2000.atomic-eggs.com "http://www.google.de/search?q=J%27accuse...!+(Ich+klage+an...!),+&ndsp=20&hl=de&start=70&sa=N" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 2.0.50727)" "-"

oder:

70.85.114.146 - - [19/Oct/2007:01:46:03 +0200] "GET /javascript:parent.theMenu.openAll/(/);/ HTTP/1.0" 404 2295 old.atomic-eggs.com "-" "Mozilla/4.0 (compatible; MSIE 6.0b; Windows NT 5.0; .NET CLR 1.0.2914)" "-"

Durch den Referrer in den Logfiles, der ja VOR [1] dem User-Agent erscheint, aber auch, wie man sieht, durch den Request, können Klammer auch vorher in der Zeile vorhanden sein.

[1] Eine Logdateizeile bei meinem 1&1-Paket folgt folgendem Aufbau:

1. IP
2. der zweite Eintrag kann ich nicht zuordnen, werde aus der Apache-Beschreibung nicht schlau, ist aber immer -
3. angemeldeter User(wenn vorhanden, sonst -)
4. Datum/Zeit-String
5. "Methode/Request Protokoll"
6. Server Response (Status Code)
7. Dateigröße in Bytes
8. Domain oder Subdomain
9. "Referrerstring" (oder "-")
10. "User-Agent-String" (oder "-" oder "Unfug" *g*)
11. "Proxy-IP" (wenn über Proxy und die IP wird mitgesendet)

Viele Grüße aus Frankfurt/Main,
Patrick

--

_ - jenseits vom delirium - _
[link:hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash]
Nichts ist unmöglich? Doch!
Heute schon gegökt?
0 79

Bekloppte User Agents zuordnen (RegExp)

Patrick Andrieu
  • programmiertechnik
  1. 0
    Cheatah
    1. 2

      UA-Statistiken fälschen

      Siechfred
      • perl
      1. 0
        Patrick Andrieu
        1. 1
          Siechfred
          1. 0

            Die erfolgreiche Fälschung

            Patrick Andrieu
            1. 1

              Das Modul zur erfolgreichen Fälschung?

              Siechfred
              1. 0
                Patrick Andrieu
                1. 0
                  Siechfred
              2. 0
                Siechfred
              3. 0
                Patrick Andrieu
                1. 0
                  Siechfred
                  1. 0
                    Patrick Andrieu
                    1. 0
                      Siechfred
                      1. 0
                        Patrick Andrieu
                        1. 0
                          Siechfred
                          1. 0
                            Patrick Andrieu
                            1. 0
                              Siechfred
                              1. 0
                                Patrick Andrieu
                                1. 0
                                  Patrick Andrieu
                                  1. 0
                                    Siechfred
                                    1. 0
                                      Patrick Andrieu
                                      1. 0
                                        Siechfred
                                        1. 0
                                          Patrick Andrieu
                                          1. 0
                                            Patrick Andrieu
                                          2. 0
                                            Siechfred
                                2. 0
                                  Siechfred
            2. 0

              Die erfolgreichen Statmaker- und -fälscher-Skripts für 1&1-User!

              Patrick Andrieu
              1. 0
                Patrick Andrieu
                1. 0
                  Struppi
                  1. 0
                    Patrick Andrieu
    2. 0
      Patrick Andrieu
      1. 0
        Cheatah
        1. 0
          Patrick Andrieu
  2. 0
    Don P
    1. 0
      Don P
    2. 0
      Patrick Andrieu
      1. 0
        Don P
        1. 0
          Patrick Andrieu
          1. 0
            Don P
            1. 0
              Patrick Andrieu
      2. 0

        Logline splitter (RegExp)

        Patrick Andrieu
  3. 2
    Struppi
    1. 0
      Patrick Andrieu
      1. 0
        Patrick Andrieu
  4. 0
    Der Martin
    1. 0
      Alexander (HH)
    2. 0
      Patrick Andrieu
      1. 0
        Der Martin
        1. 0
          Cheatah
          1. 0
            Patrick Andrieu
            1. 0
              Cheatah
        2. 0
          Patrick Andrieu
          1. 0
            Der Martin
            1. 0

              RegExp'sch ist gar nicht so schwer :)

              Siechfred
              • menschelei
    3. 0
      Patrick Andrieu
      1. 0
        Der Martin
        1. 0
          Patrick Andrieu
          1. 0
            Patrick Andrieu
            1. 0
              Struppi
      2. 0
        Ingo Turski
        1. 0
          Patrick Andrieu
          1. 0
            Ingo Turski
            1. 0
              Patrick Andrieu
              1. 0
                Ingo Turski
                1. 0
                  Patrick Andrieu
                  1. 0
                    Engin
                  2. 0
                    Engin
                    1. 0
                      Patrick Andrieu
                      1. 0
                        Engin
                        1. 0
                          Patrick Andrieu
                          1. 0
                            Engin
                            1. 0
                              Patrick Andrieu
                              1. 0
                                Engin
                                1. 0
                                  Patrick Andrieu
                                  1. 0
                                    Engin
                  3. 0
                    Ingo Turski
                    1. 0
                      Patrick Andrieu
        2. 0
          Patrick Andrieu