Counter ... wie?
Mario
- php
Hallöle!
Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen? IP funzt ja nich, wegen Proxies und Load-Farm, Cookies auch nich, könnten ja aus sein und Session-ID filtern funzt irgendwie auch nich so, hab ich gemerkt, da die SID wohl auch als Cookie gesichert bleibt (was allerdings der Effekt bei Cookies = aus is, weiss ich nich, noch nich getestet) ... jemand nen Tip?
Grüße, Mario
Hallo Mario,
Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen?
"Zuverlaessig" gibt es nicht. Vergleiche (aehnliches Problem):
"Wie kann ich eine schummelsichere Abstimmung codieren?"
http://www.dclp-faq.de/q/q-scripte-abstimmung.html
Sichtbare Counter sind sowieso "out"...
(sagt Dr. Web - und der wird es ja wissen;-)
http://drweb.de/einsteiger/outliste_1.shtml
Also, zerbrich Dir nicht den Kopf mit einem Problem, das keines ist.
Mach lieber interessante Inhalte auf Deine Website - daran
haben die Besucher mehr Spass als an einem "zuverlaessigen" Counter.
Gruss,
Thomas
Aloa! :)
Sichtbare Counter sind sowieso "out"...
(sagt Dr. Web - und der wird es ja wissen;-)
http://drweb.de/einsteiger/outliste_1.shtmlAlso, zerbrich Dir nicht den Kopf mit einem Problem, das keines ist.
Mach lieber interessante Inhalte auf Deine Website - daran
haben die Besucher mehr Spass als an einem "zuverlaessigen" Counter.
Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)
Grüße, Mario
Halihallo Mario
Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)
Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...
Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
zu korrigieren verspricht.
Viele Grüsse
Philipp
Hi,
Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)
Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...
der Spruch wirkt auch durch mehrmalige Wiederholung nicht intelligenter!
Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
zu korrigieren verspricht.
bei Statistik geht es nicht um wahre Werte, denn so etwas gibt es bei keiner Messung! Es geht darum, einen "Eindruck" zu bekommen und den erhält man meist dadurch, mögliche Fehler zu eliminieren/minimieren bzw. so zu verbessern, daß an der Gesamtaussage sich nichts gravierendes ändert.
Gruß
Reiner
Halihallo Reiner
Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)
Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...der Spruch wirkt auch durch mehrmalige Wiederholung nicht intelligenter!
kam er in diesem Thread schon vor? - OK, bin auch sonst einverstanden :)
Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
zu korrigieren verspricht.bei Statistik geht es nicht um wahre Werte, denn so etwas gibt es bei keiner Messung! Es geht darum, einen "Eindruck" zu bekommen und den erhält man meist dadurch, mögliche Fehler zu eliminieren/minimieren bzw. so zu verbessern, daß an der Gesamtaussage sich nichts gravierendes ändert.
Stimmt, ich widerspreche dir nicht. Ich habe nochmals auf die Risiken hingewiesen. Im
anderen Posting habe ich gesagt, dass ich z. B. über Cookies gehe, auf Websites mit
breiter Reichweite ist dies eine genügend gute Basis (wieviele % haben nochmal
Cookies aktiviert?), um Statistiken zu erstellen, ich selber verfahre so und glaube
meiner Statistik sogar :-)
Ich habe derart "agressiv" argumentiert, um Mario von einem, leider nur zu oft zu
hörendem Fehler zu bewahren.
Viele Grüsse
Philipp
Hi,
Yo, find ich auch. Wollt auch keinen reinnehmen. Aber Kunde wollte Counter ham ... ;)
Sag ihm, er solle keiner Statistik glauben, die er nicht selbst gefälscht hat...der Spruch wirkt auch durch mehrmalige Wiederholung nicht intelligenter!
kam er in diesem Thread schon vor? - OK, bin auch sonst einverstanden :)
in diesem nicht, aber sonst schon sehr oft.
Was mich daran stört ist, daß man zum schwarz-weiß sehen gedrängt wird.
Vielmehr gibt es meiner Erfahrung zwei Dinge bei Messungen (ist auch in der Elektrotechnik z.B. so), die man grundsätzlich beachten sollten:
ist das Ergebnis plausibel?,
ja-> wie groß ist der Fehler bzw. wo liegen Fehlerquellen und wie könnte man sie minimieren
nein-> was sollte grundsätzlich am Aufbau der Messmethode geändert werden
was ist mit dem Ergebnis anzufangen?
Das ist eine schon rel. schwierige Frage, denn selbst wenn die erste Frage mit "ja" beantwortet worden ist, muß man im Hinterkopf haben, daß NICHTS ein 100%iges Abbild der Wirklichkeit darstellt, vielmehr ist es ein Modell. Ob man mit diesem Modell etwas anfangen kann, muß man von Fall zu Fall selbst entscheiden.
--> Bei Webstatistik ist der Sinn (so wie ich ihn sehe) einen gewissen Erfolg zu messen bzw. Probleme erkennen zu können.
Als triviales Beispiel möchte ich einmal anführen, daß man z.B. eine Werbung irgendwo geschaltet hat und nun sehen will, wieviel % über einen Link von dort auf die Webseite gelangen.
Wenn man nun aus ganz anderen Quellen (im Nachhinein?!) erfährt, daß der Verkauf eines Produktes x seit Schaltung der Werbung angezogen hat, so ist dies eine u.U. gute Möglichkeit einen Erfolg der Werbung zu "messen". Das ist zwar u.U. nicht immer ganz so offensichtlich, wie ich das jetzt darstelle, aber ich kenne kein anderes Medium, wo das auch nur annähernd so gut funktioniert.
(Weiß Coca-Cola, ob der Verkauf von brauner Limo dadurch zustande kam, daß mehr Plakate geklebt wurden? Ist dies meßbar oder beruht dies auf Vermutungen. UND: Wieviel Prozent an Plakaten hätte man u.U. einsparen können, um das gleiche zu erreichen?)
Oder er soll sich mit ganz normalen Pageviews glücklich schätzen, denn alles andere
ist mindestens genauso viel gelogen, wie es "Fehler" der Messung bei Pageviews
zu korrigieren verspricht.bei Statistik geht es nicht um wahre Werte, denn so etwas gibt es bei keiner Messung! Es geht darum, einen "Eindruck" zu bekommen und den erhält man meist dadurch, mögliche Fehler zu eliminieren/minimieren bzw. so zu verbessern, daß an der Gesamtaussage sich nichts gravierendes ändert.
Stimmt, ich widerspreche dir nicht. Ich habe nochmals auf die Risiken hingewiesen. Im
anderen Posting habe ich gesagt, dass ich z. B. über Cookies gehe, auf Websites mit
breiter Reichweite ist dies eine genügend gute Basis (wieviele % haben nochmal
Cookies aktiviert?), um Statistiken zu erstellen, ich selber verfahre so und glaube
meiner Statistik sogar :-)
Ich habe derart "agressiv" argumentiert, um Mario von einem, leider nur zu oft zu
hörendem Fehler zu bewahren.
s.o.
und lies mal den Thead im Archiv, den ich weiter oben angegeben habe.
Gruß
Reiner
Halihallo Reiner
Was mich daran stört ist, daß man zum schwarz-weiß sehen gedrängt wird.
Nun, da hast du recht. Wenn wir zusammen sprechen würden, würde es auch anders klingen,
jedoch muss man in einem Ort wie dem Forum oft mit den Augen der "anderen" sehen. Dort
ist oft ein simplifiziertes Weltbild festzustellen, welches man oft nur durch
Übertreibung und Schwarz-Weiss-Malerei wieder zurechtbiegen kann. Nun, das kann man sehen
wie man will, ich will jetzt nicht darüber streiten.
- ist das Ergebnis plausibel?,
ja-> wie groß ist der Fehler bzw. wo liegen Fehlerquellen und wie könnte man sie minimieren
nein-> was sollte grundsätzlich am Aufbau der Messmethode geändert werden
Signifikanz eines Ergebnisses > 5%, ja.
- was ist mit dem Ergebnis anzufangen?
Das ist eine schon rel. schwierige Frage, denn selbst wenn die erste Frage mit "ja" beantwortet worden ist, muß man im Hinterkopf haben, daß NICHTS ein 100%iges Abbild der Wirklichkeit darstellt, vielmehr ist es ein Modell. Ob man mit diesem Modell etwas anfangen kann, muß man von Fall zu Fall selbst entscheiden.
Validität: Wird wirklich das gemessen, was man messen will?
--> Bei Webstatistik ist der Sinn (so wie ich ihn sehe) einen gewissen Erfolg zu messen bzw. Probleme erkennen zu können.
Als triviales Beispiel möchte ich einmal anführen, daß man z.B. eine Werbung irgendwo geschaltet hat und nun sehen will, wieviel % über einen Link von dort auf die Webseite gelangen.
Ja, wobei dies wesentlich zuverlässiger festzustellen ist, als das Widererkennen des
Besuchers. Aber ich verstehe, was du sagen möchtest.
Wenn man nun aus ganz anderen Quellen (im Nachhinein?!) erfährt, daß der Verkauf eines Produktes x seit Schaltung der Werbung angezogen hat, so ist dies eine u.U. gute Möglichkeit einen Erfolg der Werbung zu "messen". Das ist zwar u.U. nicht immer ganz so offensichtlich, wie ich das jetzt darstelle, aber ich kenne kein anderes Medium, wo das auch nur annähernd so gut funktioniert.
Ja, ich komme ja selber aus der Branche (Internet-Werbung), da kann ich dir nur recht
geben!
Viele Grüsse
Philipp
PS: Mei, du hast ja RECHT Reiner! :-))
Halihallo Mario
Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen? IP funzt ja nich, wegen Proxies und Load-Farm, Cookies auch nich, könnten ja aus sein und Session-ID filtern funzt irgendwie auch nich so, hab ich gemerkt, da die SID wohl auch als Cookie gesichert bleibt (was allerdings der Effekt bei Cookies = aus is, weiss ich nich, noch nich getestet) ... jemand nen Tip?
Ein Tip? - Lass es sein oder miss das, was da ist.
Ein Pageview ist ein Pageview, egal, ob er von derselben Person ausgelöst wird, oder
nicht. Das was du hier messen möchtest, sind sogenannte Unique User. Derartige
Messmethoden werden willkührlich und sind verfälscht. Gute Ergebnisse erhält man durch
Kombination mehrerer Identifikationsmethoden, also erst Identifikation über Cookies,
dann[1] durch Hash-Fingerprint (MD5 Checksum z. B.) über Client-IP und UserAgent...
Letzere Methode gibt grosse Messfehler, selbst bei kleinen Zeitspannen wie 20min sind die
Streuverluste sehr gross.
[1] Fallback
Viele Grüsse
Philipp
Grüße! :)
Ein Tip? - Lass es sein oder miss das, was da ist.
Ein Pageview ist ein Pageview, egal, ob er von derselben Person ausgelöst wird, oder
nicht. Das was du hier messen möchtest, sind sogenannte Unique User. Derartige
Messmethoden werden willkührlich und sind verfälscht. Gute Ergebnisse erhält man durch
Kombination mehrerer Identifikationsmethoden, also erst Identifikation über Cookies,
dann[1] durch Hash-Fingerprint (MD5 Checksum z. B.) über Client-IP und UserAgent...
Letzere Methode gibt grosse Messfehler, selbst bei kleinen Zeitspannen wie 20min sind die
Streuverluste sehr gross.
Hm ... yo, muss ich wohl Kompromisse eingehen. Im Moment is der Counter zu kritisch, da er (IP == Pool || SID == Pool) && (Date == Heute)? checkt. Allerdings stammen die IPs, die PHP zurückliefert aus der Load-Farm vom Provider, kann man somit knicken, da die bei jedem Request anders sein kann. Und nur SID + Datum ... hm ... müsst ich mal probieren ... sieht fast nach dem einzig aktzeptablen Weg aus ...
Wie meinst du das mit Hash-Fingerprint der Client-IP und UserAgent? Die richtige Client-IP bekomm ich ja nie, hab schon probiert ...
Danke für die Tips!
Mario
Halihallo Mario
Hm ... yo, muss ich wohl Kompromisse eingehen. Im Moment is der Counter zu kritisch, da er (IP == Pool || SID == Pool) && (Date == Heute)? checkt. Allerdings stammen die IPs, die PHP zurückliefert aus der Load-Farm vom Provider, kann man somit knicken, da die bei jedem Request anders sein kann.
Es gibt noch tausend andere Gründe, warum die IP nicht eindeutig ist... Load-Balancing
und Proxi-Server sind nur zwei davon.
Und nur SID + Datum ... hm ... müsst ich mal probieren ... sieht fast nach dem einzig aktzeptablen Weg aus ...
Woher kommt SID? - Aus dem Cookie? - Dann nein, erst auf Cookies testen, wenn du einen
empfängst, ist der Client identifiziert, wenn nicht, kommt erst das IP/UA-
Lookup/Fallback.
Wie meinst du das mit Hash-Fingerprint der Client-IP und UserAgent? Die richtige Client-IP bekomm ich ja nie, hab schon probiert ...
Reiners referenzierte Thread beantwortet's. Mit Hash-Fingerprint ist eine Methode
gemeint, um die Daten etwas zu reduzieren, anhand Browsertyp, -version, verwendetes
Betriebssystem, Farbauflösung und zu guter letzt auch der IP etc. etc. erstellst du
ein "Fingerabdruck" des Clients (leider, wie schon gesagt, nicht ganz so sicher, wie
der Fingerabdruck des Menschen :)), über diesen Fingerabdruck wird er später wieder-
erkannt (um nicht tausend Bytes pro Client zu speichern, erstellt mein oft eine 128bit
"Quersumme" davon, Hash genannt => MD5, CRC32, Alder32, SHA, ... z. B.).
Natürlich kriegst du nicht die richtige Client-IP, das ist aber auch nicht wichtig. Es
geht nur darum, dass man _möglichst_ eine IP und UserAgent-Informationen einem
Computer zuordnen kann und das _ist eben möglich_, nur mit sehr grossen Streuverlusten.
Meine Meinung: Lass es, denn es ist der Aufwand nicht wert, das für einen simplen
Counter? - Ich sage nein. Zudem, wenn du schon UniqueUsers (oder verwandte) Messen
möchtest, dann verlass dich doch einfach auf Cookies, einfach zu implementieren,
auf 0815-Otto-Normalverbraucher-Sites von Clients oft unterstützt, da Wissen um sie zu
deaktivieren nicht vorhanden und die Identifikation, falls Cookies unterstützt sind, ist
100% (naja, 99.999% für irgendwelche ScriptKiddies, die gerne Spass haben und die Cookies
bewusst fälschen).
Viele Grüsse
Philipp
Hi,
Anhand welcher Filter kann ich denn einen zuverlässigen Counter erstellen? IP funzt ja nich, wegen Proxies und Load-Farm, Cookies auch nich, könnten ja aus sein und Session-ID filtern funzt irgendwie auch nich so, hab ich gemerkt, da die SID wohl auch als Cookie gesichert bleibt (was allerdings der Effekt bei Cookies = aus is, weiss ich nich, noch nich getestet) ... jemand nen Tip?
lies Dir das vielleicht mal durch:
http://forum.de.selfhtml.org/archiv/2003/3/40665/
Gruß
Reiner