Manticor: Zur Browser und User-Identifikation

Hallo!

Ich habe - zur Übung - einen Counter gescriptet. Viele Meldungen kann er auch ganz gut interpretieren, aber einige "Mozillas" (z.B. Mozilla/4.08 [de]C-DT) und so, kenne ich einfach nicht und damit auch nicht mein Counter.

  1. Gibt es irgendwo im Web eine Zusammenstellung, wie sich welcher Browser identifiziert?

  2. Gibt es sowas für die verschiedenen OS?

Viele IPs sind ja auch im "Klartext" (also beispielsweise per gethostbyid) nicht sehr aussagekräftig. Gerade T-Online identifiziert sich scheußlich (z.B. p3EE35646.dip.t-dialin.net).

  1. Kann man sowas nochmal örtlich zuordnen? Also wo der eigentliche Einwahlserver stand?

Danke schonmal.

Gruss, Stefan

  1. Moin,

    1. Gibt es irgendwo im Web eine Zusammenstellung, wie sich welcher Browser identifiziert?
    2. Gibt es sowas für die verschiedenen OS?

    http://browserlist.browser.org/browser_list.shtml (Achtung, *sehr* lang)

    Viele IPs sind ja auch im "Klartext" (also beispielsweise per gethostbyid) nicht sehr aussagekräftig. Gerade T-Online identifiziert sich scheußlich (z.B. p3EE35646.dip.t-dialin.net).

    das sind dann nicht die IPs sondern die Hostnamen...

    1. Kann man sowas nochmal örtlich zuordnen? Also wo der eigentliche Einwahlserver stand?

    nein, es sei denn zu hast Zugang zu den Logs der jeweiligen Provider.

    Viele Gruesse,

    n.d.p.

  2. Hallo Stefan!

    1. Gibt es irgendwo im Web eine Zusammenstellung, wie sich welcher Browser identifiziert?

    Im kleineren Rahmen als beim Link von n.d. kannst Du hier, anhand der Mai-Logfile meines Statcounters, die UserAgent-Kennungen von Netscape, Opera und IE-Browsern verfolgen:

    http://atomic-eggs.com/cgi-bin/Netsi_Brow.cgi
    http://atomic-eggs.com/cgi-bin/Opera_Brow.cgi
    http://atomic-eggs.com/cgi-bin/MSIE_Brow.cgi

    und speziell für IE

    http://atomic-eggs.com/cgi-bin/MSIE_Brow2.cgi

    hier kannst Du als Parameter hinter "cgi" noch "?a=1" für Januar, "?a=4" für April eingeben. Februar und Maerz habe ich nicht mehr auf dem Server.

    1. Gibt es sowas für die verschiedenen OS?

    Viele IPs sind ja auch im "Klartext" (also beispielsweise per gethostbyid) nicht sehr aussagekräftig. Gerade T-Online identifiziert sich scheußlich (z.B. p3EE35646.dip.t-dialin.net).

    Hier ist Deine Aussage mit Vorsicht zu geniessen. Alle diese p(.*).dip.t-dialin.(.*) sind nicht unbedingt T-Online, sondern können auch IMHO (man berichtige mich, wenn ich irre) von Provis stammen, die bei Telekom Leitungen mieten.

    1. Kann man sowas nochmal örtlich zuordnen? Also wo der eigentliche Einwahlserver stand?

    Würde mich auch interessieren (für mein eigener Zähler):
    http://atomic-eggs.com/cgi-bin/html_log.cgi (noch im Aufbau, daher ist nicht alles anzeigbar - z.B. das mit den Zähldateien)

    Danke schonmal.

    Vielleicht lernen wir gegenseitig was von unseren Counter-"Versuchen" ;-)

    Patrick
    <hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash>

    1. Re!

      Vielleicht lernen wir gegenseitig was von unseren Counter-"Versuchen" ;-)

      Vielleicht auch noch von Interesse:

      http://atomic-eggs.com/cgi-bin/Uhrzeitentest.cgi (hier nur Stunde 12-13Uhr)

      http://atomic-eggs.com/cgi-bin/http://atomic-eggs.com/cgi-bin/Zaehldateien.cgi (Counter basiert auf "Zähldateien" zählen, jede Seite, die gezählt werden soll, hat daher einen Namen im Counteraufruf)

      http://atomic-eggs.com/cgi-bin/Herkunft.cgi?a=4, da fange ich mit der Auswertung erst an, daher interessieren mich die Antworten auf Deine Frage besonders - Vorsicht hier: lange Ladezeit!

      http://atomic-eggs.com/cgi-bin/http://atomic-eggs.com/cgi-bin/Aufloesungen2.cgi Und da habe ich eine Frage. Wie zuverlässig ist denn die Abfrage nach screen.width und screen.height?!? Es kommen die Unmöglichsten Sachen zusammen, zum Beispiel mehr als 3000 Pixel widht... Sind es z.B. Grafiker, die zwei Monis benutzen? Daher habe ich versucht, sie zu gruppieren (ganz unten), ist natürlich nur als Orientierung nützlich, da anhand der vielen verschiedenen zurückgegebenen Werte eine richtige Auswertung unmöglich ist.

      Hier kann man auch mit "?a=1" bis 5 alle vorhandenen Logdateien durchsuchen, wobei 2 und 3 nichts bringen, da diese ja nicht mehr auf dem Server vorhanden sind.

      Patrick
      <hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash>

      1. Tach auch Patrick,

        http://atomic-eggs.com/cgi-bin/Herkunft.cgi?a=4, da fange ich mit der Auswertung erst an, daher interessieren mich die Antworten auf Deine Frage besonders - Vorsicht hier: lange Ladezeit!

        Die habe ich mir mal schnell angesehen, ob da zufaellig mein Arbeitgeber drin ist (ist er, taucht einmal auf). Ich habe so meine Zweifel dass Du damit sehr weit kommst.

        Da steht naemlich xy.firma.com in Deinen Logfiles, was Dir nicht viel weiterhilft. Wenn ich von der Firma ins Web gehe, gehe ich ja ueber einen Proxy, und ich habe so meine Zweifel dass Dir jemand erzaehlt was die ganzen Abkuerzungen bedeuten. Der Firmenname bleibt gleich, nur der Proxy aendert sich. Und die stehen auf der ganzen Welt verteilt: Mehrere in den USA (in verschiedenen Sites), einer hier in England, in Irland duerfte einer stehen, Rest von Europa weiss ich jetzt nicht und was da noch alles in APAC ist noch weniger. Das Problem fuer Dich ist dass selbst wenn es Dir gelingt, die zu identifizieren, es Dir nicht sagt wo ich sitze. Solange ich nicht mit "autoproxy" (der nimmt den jeweils naechstgelegenen Proxy) surfe, kann ich einen in den USA einstellen (waere zwar schwachsinnig, aber ich koennte es). Dann wuerdest Du denken ich besuche Dich aus den USA, waehrend ich in Wirklichkeit in England bin.

        Viel Spass noch bei Deiner Analyse ;-)

        Gruesse aus dem wolkigen Swindon,
        Armin

        1. Hallo Armin!

          Da steht naemlich xy.firma.com in Deinen Logfiles, was Dir nicht viel weiterhilft. Wenn ich von der Firma ins Web gehe, gehe ich ja ueber einen Proxy, und ich habe so meine Zweifel dass Dir jemand erzaehlt was die ganzen Abkuerzungen bedeuten. Der Firmenname bleibt gleich, nur der Proxy aendert sich. Und die stehen auf der ganzen Welt verteilt

          Ist mir bewußt. Countermania, den Dienst, den ich früher beanspruchte, und der der Grund ist, warum ich mich an einen eigenen Counter herantraute *g*, zählte alle com, net, org und edu als USA-Besucher... Natürlich war demnach die Mehrzahl meiner Besucher Amis ;-)

          So soll die Auswertung, die ich aufstellen will, auch nur eine Idee vom ganzen geben - was anderes kann eine Hostauswertung sowieso nicht sein. Wenn .fr am Stringende steht, war der Besucher zwar mit großer wahrscheinlichkeit auch aus Frankreich, bei .dk und so sicherlich auch. Aber alle com, net, org usw als Amerikaner, alle .de als Deutsche aufzulisten ... das wäre *ganz* falsch!

          Daher wird über die Auswertung nicht stehen: "Soundso viele Besucher kamen aus Amerika, Canada, Frankreich, etc..." sondern schlicht einfach: "Soundso viele Besucher kamen über einen Provider, der sich Server oder weiterer Dienste bedient, welche in.... angesiedelt sind. Oder so. Werde an der Formulierung noch herumfeilen.

          Viel Spass noch bei Deiner Analyse ;-)

          Jau, danke, ist schon interessant!

          Patrick
          <hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash>

  3. Hallo Manticor!

    Hallo!

    Ich habe - zur Übung - einen Counter gescriptet. Viele Meldungen kann er auch ganz gut interpretieren, aber einige "Mozillas" (z.B. Mozilla/4.08 [de]C-DT) und so, kenne ich einfach nicht und damit auch nicht mein Counter.

    1. Gibt es irgendwo im Web eine Zusammenstellung, wie sich welcher Browser identifiziert?

    Mozilla sagen sie alle ausser Opera,
    und was die sonstigen Strings angeht mal ein paar Besipiele:

    Mozilla/5.0 (Windows; U; Win 9x 4.90; de-DE; cebit) Gecko/20010131 Netscape6/6.01

    Mozilla/4.73 [de]C-CCK-MCD QXW03243  (Win98; U)

    Mozilla/4.0 (compatible; MSIE 5.01; Windows 98; QXW0330f)

    und mein persönlicher Favorit:

    Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt; T-Online Internatinal AG)
    (die sind sogar zu blöde ihren eigenen Firmennamen zu schreiben.)

    Das QXW Zeugs gibt es in beliebigen Varianten, wenn du ne kleine Seite hast die nur ein paar Leute kennen, kannst du deine Besucher fast namentlich begrüssen ;-)

    Wenn du mal nach "T-Online Internatinal" googlest wirst du auf jede Menge Statistiken und damit Browserlisten stossen.

    Evtl hilft dir auch
    http://www.mozilla.org/build/revised-user-agent-strings.html
    weiter.

    Viele IPs sind ja auch im "Klartext" (also beispielsweise per gethostbyid) nicht sehr aussagekräftig. Gerade T-Online identifiziert sich scheußlich (z.B. p3EE35646.dip.t-dialin.net).
    3) Kann man sowas nochmal örtlich zuordnen? Also wo der eigentliche Einwahlserver stand?

    Bei T-Online bekommst du mit traceroute (tracert unter Windows) irgendwo in der Route sowas wie:

    4  HAL-rg1.HAL.net.DTAG.DE (193.158.126.35)  159 ms  129 ms  148 ms

    dort ist das Autokennzeichen des Einwahl-Knotens drin, diese IP stammt aus Halle bzw. Umgegend.

    Anmerkung: Traceroute ist nicht für sowas da, sinnloses Leute anpingen (und das macht Traceroute letztlich) nervt. Ein Script das sowas systematisch mit einer Logdatei macht könnte deinem Prvodier und nachfolgend dann dir durchaus Ärger einbringen.

    Gruss,
     Carsten

    1. Hallo Carsten!

      Mozilla sagen sie alle ausser Opera,

      Nicht ganz richtig:

      http://atomic-eggs.com/cgi-bin/Opera_Brow.cgi

      ;-)

      und mein persönlicher Favorit

      Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt; T-Online Internatinal AG)
      (die sind sogar zu blöde ihren eigenen Firmennamen zu schreiben.)

      Da der UserAgent sich manipulieren lässt, gibt es manchmal sehr lustige Sachen (habe schon mal "f... u" vorgefunden):

      Mozilla/5.0 (compatible; MSIE 7.0; Linux)

      MSIE 7 ???

      Oder:

      Mozilla/8.1 (compatible; MSIE 5.6; Windows0815)

      Windows 08/15! Auch gut:

      Mozilla/4.0 (compatible; MSIE 5.5; Swen; Swen Wacker; Windows 98)

      Der ist aber hier bekannt ;-) Der auch:

      Mozilla/4.0 (compatible; MSIE 5.5; Windows 98; Win 9x 4.90; http://www.atomic-eggs.com/)

      ;-)

      Patrick
      <hatehtehpehdoppelpunktslashslashwehwehwehpunktatomicminuseggspunktcomslash>

  4. Hi!

    Danke für die vielen Antworten. Werde erstmal eine Weile damit beschäftigt sein die Hinweise abzugrasen :).

    @Patrick: Falls ich irgendwas Aussergewöhnliches herausbekomme, sage ich Dir Bescheid.

    Gruss