Mario: Counter ... wie?

Hallöle!

Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen? IP funzt ja nich, wegen Proxies und Load-Farm, Cookies auch nich, könnten ja aus sein und Session-ID filtern funzt irgendwie auch nich so, hab ich gemerkt, da die SID wohl auch als Cookie gesichert bleibt (was allerdings der Effekt bei Cookies = aus is, weiss ich nich, noch nich getestet) ... jemand nen Tip?

Grüße, Mario

  1. Hallo Mario,

    Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen?

    "Zuverlaessig" gibt es nicht. Vergleiche (aehnliches Problem):
    "Wie kann ich eine schummelsichere Abstimmung codieren?"
    http://www.dclp-faq.de/q/q-scripte-abstimmung.html

    Sichtbare Counter sind sowieso "out"...
    (sagt Dr. Web - und der wird es ja wissen;-)
    http://drweb.de/einsteiger/outliste_1.shtml

    Also, zerbrich Dir nicht den Kopf mit einem Problem, das keines ist.
    Mach lieber interessante Inhalte auf Deine Website - daran
    haben die Besucher mehr Spass als an einem "zuverlaessigen" Counter.

    Gruss,
    Thomas

    1. Aloa! :)

      Sichtbare Counter sind sowieso "out"...
      (sagt Dr. Web - und der wird es ja wissen;-)
      http://drweb.de/einsteiger/outliste_1.shtml

      Also, zerbrich Dir nicht den Kopf mit einem Problem, das keines ist.
      Mach lieber interessante Inhalte auf Deine Website - daran
      haben die Besucher mehr Spass als an einem "zuverlaessigen" Counter.

      Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)

      Grüße, Mario

      1. Halihallo Mario

        Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)

        Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...
        Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
        ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
        zu korrigieren verspricht.

        Viele Grüsse

        Philipp

        1. Hi,

          Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)

          Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...

          der Spruch wirkt auch durch mehrmalige Wiederholung nicht intelligenter!

          Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
          ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
          zu korrigieren verspricht.

          bei Statistik geht es nicht um wahre Werte, denn so etwas gibt es bei keiner Messung! Es geht darum, einen "Eindruck" zu bekommen und den erhält man meist dadurch, mögliche Fehler zu eliminieren/minimieren bzw. so zu verbessern, daß an der Gesamtaussage sich nichts gravierendes ändert.

          Gruß
          Reiner

          1. Halihallo Reiner

            Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)
            Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...

            der Spruch wirkt auch durch mehrmalige Wiederholung nicht intelligenter!

            kam er in diesem Thread schon vor? - OK, bin auch sonst einverstanden :)

            Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
            ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
            zu korrigieren verspricht.

            bei Statistik geht es nicht um wahre Werte, denn so etwas gibt es bei keiner Messung! Es geht darum, einen "Eindruck" zu bekommen und den erhält man meist dadurch, mögliche Fehler zu eliminieren/minimieren bzw. so zu verbessern, daß an der Gesamtaussage sich nichts gravierendes ändert.

            Stimmt, ich widerspreche dir nicht. Ich habe nochmals auf die Risiken hingewiesen. Im
            anderen Posting habe ich gesagt, dass ich z. B. über Cookies gehe, auf Websites mit
            breiter Reichweite ist dies eine genügend gute Basis (wieviele % haben nochmal
            Cookies aktiviert?), um Statistiken zu erstellen, ich selber verfahre so und glaube
            meiner Statistik sogar :-)
            Ich habe derart "agressiv" argumentiert, um Mario von einem, leider nur zu oft zu
            hörendem Fehler zu bewahren.

            Viele Grüsse

            Philipp

            1. Hi,

              Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)
              Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...

              der Spruch wirkt auch durch mehrmalige Wiederholung nicht intelligenter!

              kam er in diesem Thread schon vor? - OK, bin auch sonst einverstanden :)

              in diesem nicht, aber sonst schon sehr oft.
              Was mich daran stört ist, daß man zum schwarz-weiß sehen gedrängt wird.
              Vielmehr gibt es meiner Erfahrung zwei Dinge bei Messungen (ist auch in der Elektrotechnik z.B. so), die man grundsätzlich beachten sollten:

              • ist das Ergebnis plausibel?,
                ja-> wie groß ist der Fehler bzw. wo liegen Fehlerquellen und wie könnte man sie minimieren
                nein-> was sollte grundsätzlich am Aufbau der Messmethode geändert werden

              • was ist mit dem Ergebnis anzufangen?
                Das ist eine schon rel. schwierige Frage, denn selbst wenn die erste Frage mit "ja" beantwortet worden ist, muß man im Hinterkopf haben, daß NICHTS ein 100%iges Abbild der Wirklichkeit darstellt, vielmehr ist es ein Modell. Ob man mit diesem Modell etwas anfangen kann, muß man von Fall zu Fall selbst entscheiden.

              --> Bei Webstatistik ist der Sinn (so wie ich ihn sehe) einen gewissen Erfolg zu messen bzw. Probleme erkennen zu können.
              Als triviales Beispiel möchte ich einmal anführen, daß man z.B. eine Werbung irgendwo geschaltet hat und nun sehen will, wieviel % über einen Link von dort auf die Webseite gelangen.
              Wenn man nun aus ganz anderen Quellen (im Nachhinein?!) erfährt, daß der Verkauf eines Produktes x seit Schaltung der Werbung angezogen hat, so ist dies eine u.U. gute Möglichkeit einen Erfolg der Werbung zu "messen". Das ist zwar u.U. nicht immer ganz so offensichtlich, wie ich das jetzt darstelle, aber ich kenne kein anderes Medium, wo das auch nur annähernd so gut funktioniert.
              (Weiß Coca-Cola, ob der Verkauf von brauner Limo dadurch zustande kam, daß mehr Plakate geklebt wurden? Ist dies meßbar oder beruht dies auf Vermutungen. UND: Wieviel Prozent an Plakaten hätte man u.U. einsparen können, um das gleiche zu erreichen?)

              Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
              ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
              zu korrigieren verspricht.

              bei Statistik geht es nicht um wahre Werte, denn so etwas gibt es bei keiner Messung! Es geht darum, einen "Eindruck" zu bekommen und den erhält man meist dadurch, mögliche Fehler zu eliminieren/minimieren bzw. so zu verbessern, daß an der Gesamtaussage sich nichts gravierendes ändert.

              Stimmt, ich widerspreche dir nicht. Ich habe nochmals auf die Risiken hingewiesen. Im
              anderen Posting habe ich gesagt, dass ich z. B. über Cookies gehe, auf Websites mit
              breiter Reichweite ist dies eine genügend gute Basis (wieviele % haben nochmal
              Cookies aktiviert?), um Statistiken zu erstellen, ich selber verfahre so und glaube
              meiner Statistik sogar :-)
              Ich habe derart "agressiv" argumentiert, um Mario von einem, leider nur zu oft zu
              hörendem Fehler zu bewahren.

              s.o.

              und lies mal den Thead im Archiv, den ich weiter oben angegeben habe.

              Gruß
              Reiner

              1. Halihallo Reiner

                Was mich daran stört ist, daß man zum schwarz-weiß sehen gedrängt wird.

                Nun, da hast du recht. Wenn wir zusammen sprechen würden, würde es auch anders klingen,
                jedoch muss man in einem Ort wie dem Forum oft mit den Augen der "anderen" sehen. Dort
                ist oft ein simplifiziertes Weltbild festzustellen, welches man oft nur durch
                Übertreibung und Schwarz-Weiss-Malerei wieder zurechtbiegen kann. Nun, das kann man sehen
                wie man will, ich will jetzt nicht darüber streiten.

                • ist das Ergebnis plausibel?,
                  ja-> wie groß ist der Fehler bzw. wo liegen Fehlerquellen und wie könnte man sie minimieren
                  nein-> was sollte grundsätzlich am Aufbau der Messmethode geändert werden

                Signifikanz eines Ergebnisses > 5%, ja.

                • was ist mit dem Ergebnis anzufangen?
                  Das ist eine schon rel. schwierige Frage, denn selbst wenn die erste Frage mit "ja" beantwortet worden ist, muß man im Hinterkopf haben, daß NICHTS ein 100%iges Abbild der Wirklichkeit darstellt, vielmehr ist es ein Modell. Ob man mit diesem Modell etwas anfangen kann, muß man von Fall zu Fall selbst entscheiden.

                Validität: Wird wirklich das gemessen, was man messen will?

                --> Bei Webstatistik ist der Sinn (so wie ich ihn sehe) einen gewissen Erfolg zu messen bzw. Probleme erkennen zu können.
                Als triviales Beispiel möchte ich einmal anführen, daß man z.B. eine Werbung irgendwo geschaltet hat und nun sehen will, wieviel % über einen Link von dort auf die Webseite gelangen.

                Ja, wobei dies wesentlich zuverlässiger festzustellen ist, als das Widererkennen des
                Besuchers. Aber ich verstehe, was du sagen möchtest.

                Wenn man nun aus ganz anderen Quellen (im Nachhinein?!) erfährt, daß der Verkauf eines Produktes x seit Schaltung der Werbung angezogen hat, so ist dies eine u.U. gute Möglichkeit einen Erfolg der Werbung zu "messen". Das ist zwar u.U. nicht immer ganz so offensichtlich, wie ich das jetzt darstelle, aber ich kenne kein anderes Medium, wo das auch nur annähernd so gut funktioniert.

                Ja, ich komme ja selber aus der Branche (Internet-Werbung), da kann ich dir nur recht
                geben!

                Viele Grüsse

                Philipp

                PS: Mei, du hast ja RECHT Reiner! :-))

  2. Halihallo Mario

    Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen? IP funzt ja nich, wegen Proxies und Load-Farm, Cookies auch nich, könnten ja aus sein und Session-ID filtern funzt irgendwie auch nich so, hab ich gemerkt, da die SID wohl auch als Cookie gesichert bleibt (was allerdings der Effekt bei Cookies = aus is, weiss ich nich, noch nich getestet) ... jemand nen Tip?

    Ein Tip? - Lass es sein oder miss das, was da ist.
    Ein Pageview ist ein Pageview, egal, ob er von derselben Person ausgelöst wird, oder
    nicht. Das was du hier messen möchtest, sind sogenannte Unique User. Derartige
    Messmethoden werden willkührlich und sind verfälscht. Gute Ergebnisse erhält man durch
    Kombination mehrerer Identifikationsmethoden, also erst Identifikation über Cookies,
    dann[1] durch Hash-Fingerprint (MD5 Checksum z. B.) über Client-IP und UserAgent...
    Letzere Methode gibt grosse Messfehler, selbst bei kleinen Zeitspannen wie 20min sind die
    Streuverluste sehr gross.

    [1] Fallback

    Viele Grüsse

    Philipp

    1. Grüße! :)

      Ein Tip? - Lass es sein oder miss das, was da ist.
      Ein Pageview ist ein Pageview, egal, ob er von derselben Person ausgelöst wird, oder
      nicht. Das was du hier messen möchtest, sind sogenannte Unique User. Derartige
      Messmethoden werden willkührlich und sind verfälscht. Gute Ergebnisse erhält man durch
      Kombination mehrerer Identifikationsmethoden, also erst Identifikation über Cookies,
      dann[1] durch Hash-Fingerprint (MD5 Checksum z. B.) über Client-IP und UserAgent...
      Letzere Methode gibt grosse Messfehler, selbst bei kleinen Zeitspannen wie 20min sind die
      Streuverluste sehr gross.

      Hm ... yo, muss ich wohl Kompromisse eingehen. Im Moment is der Counter zu kritisch, da er (IP == Pool || SID == Pool) && (Date == Heute)? checkt. Allerdings stammen die IPs, die PHP zurückliefert aus der Load-Farm vom Provider, kann man somit knicken, da die bei jedem Request anders sein kann. Und nur SID + Datum ... hm ... müsst ich mal probieren ... sieht fast nach dem einzig aktzeptablen Weg aus ...

      Wie meinst du das mit Hash-Fingerprint der Client-IP und UserAgent? Die richtige Client-IP bekomm ich ja nie, hab schon probiert ...

      Danke für die Tips!

      Mario

      1. Halihallo Mario

        Hm ... yo, muss ich wohl Kompromisse eingehen. Im Moment is der Counter zu kritisch, da er (IP == Pool || SID == Pool) && (Date == Heute)? checkt. Allerdings stammen die IPs, die PHP zurückliefert aus der Load-Farm vom Provider, kann man somit knicken, da die bei jedem Request anders sein kann.

        Es gibt noch tausend andere Gründe, warum die IP nicht eindeutig ist... Load-Balancing
        und Proxi-Server sind nur zwei davon.

        Und nur SID + Datum ... hm ... müsst ich mal probieren ... sieht fast nach dem einzig aktzeptablen Weg aus ...

        Woher kommt SID? - Aus dem Cookie? - Dann nein, erst auf Cookies testen, wenn du einen
        empfängst, ist der Client identifiziert, wenn nicht, kommt erst das IP/UA-
        Lookup/Fallback.

        Wie meinst du das mit Hash-Fingerprint der Client-IP und UserAgent? Die richtige Client-IP bekomm ich ja nie, hab schon probiert ...

        Reiners referenzierte Thread beantwortet's. Mit Hash-Fingerprint ist eine Methode
        gemeint, um die Daten etwas zu reduzieren, anhand Browsertyp, -version, verwendetes
        Betriebssystem, Farbauflösung und zu guter letzt auch der IP etc. etc. erstellst du
        ein "Fingerabdruck" des Clients (leider, wie schon gesagt, nicht ganz so sicher, wie
        der Fingerabdruck des Menschen :)), über diesen Fingerabdruck wird er später wieder-
        erkannt (um nicht tausend Bytes pro Client zu speichern, erstellt mein oft eine 128bit
        "Quersumme" davon, Hash genannt => MD5, CRC32, Alder32, SHA, ... z. B.).
        Natürlich kriegst du nicht die richtige Client-IP, das ist aber auch nicht wichtig. Es
        geht nur darum, dass man _möglichst_ eine IP und UserAgent-Informationen einem
        Computer zuordnen kann und das _ist eben möglich_, nur mit sehr grossen Streuverlusten.

        Meine Meinung: Lass es, denn es ist der Aufwand nicht wert, das für einen simplen
        Counter? - Ich sage nein. Zudem, wenn du schon UniqueUsers (oder verwandte) Messen
        möchtest, dann verlass dich doch einfach auf Cookies, einfach zu implementieren,
        auf 0815-Otto-Normalverbraucher-Sites von Clients oft unterstützt, da Wissen um sie zu
        deaktivieren nicht vorhanden und die Identifikation, falls Cookies unterstützt sind, ist
        100% (naja, 99.999% für irgendwelche ScriptKiddies, die gerne Spass haben und die Cookies
        bewusst fälschen).

        Viele Grüsse

        Philipp

  3. Hi,

    Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen? IP funzt ja nich, wegen Proxies und Load-Farm, Cookies auch nich, könnten ja aus sein und Session-ID filtern funzt irgendwie auch nich so, hab ich gemerkt, da die SID wohl auch als Cookie gesichert bleibt (was allerdings der Effekt bei Cookies = aus is, weiss ich nich, noch nich getestet) ... jemand nen Tip?

    lies Dir das vielleicht mal durch:
    http://forum.de.selfhtml.org/archiv/2003/3/40665/

    Gruß
    Reiner