Hallo,
IMHO geht das nur wenn Du schon auf der Seite dafür sorgst das Du user wiedererkennen kannst, also entweder durch cookies oder durch eine Session(was sich gegenseitig nicht ausschließt).
es gibt noch viel mehr Dinge, die Du teilweise auch unten beschreibst! Cookies sind der Idealfall, Sessions wären auch möglich.
Ich wüßte nicht wie eine Programm aus normalen Logfiles irgendwelche Pfade nachvollziehen wollte, woran?
An der IP?
Geht nicht, kann wecheln oder bei mehreren Leuten gleich sein.
Am User-Agent?
Kann durch User und proxy sogar dynamisch manipuliert, oder ganz weggelassen werden.
Außerdem soll es mehrere Leute geben die mit Windows XP und IE 6 unterwegs sind ;-)
Was bleibt da noch?
Wenn ein Programm verspricht das es das trotzdem kann dann lügt der Werbetext(er) meiner Meinung nach.
Das würde ich so nicht behaupten und zwar unter folgendem Hintergrund:
Du hast oben schon Beispiele gebracht, wie man einen User anhand eines Indizes erkennen könnte. Oder aber auch an einem anderen. Du gehst direkt zu den Fällen über, daß erstens mehrere gleichzeitig mit gleicher IP unterwegs sein könnten und zweitens bestimmte Daten nicht vorhanden sind. Dies kann natürlich sein!
Aber spinnen wir den Gedanken der Erkennungsmerkmale mal weiter und verbinden mehrere Merkmale:
Was glaubst Du, wieviele Leute mit gleicher IP (u.U. vom Proxy), gleichem Browser, gleicher Farbtiefe, gleichem Betriebssystem, usw. sich in einem bestimmten Zeitintervall in ein und der gleichen Struktur bewegen. Selbst bei großen Sites kann anhand dieser Datenverbindungen noch einzelne Leute sehr gut erkennen!
Wenn dies nicht der Fall ist, was aufgrund meiner Erfahrung wirklich selten ist, muß man dazu sagen, daß es sich ja generell um Statistik handelt. D.h. den "Werbetexter", der behauptet, seine Darstellungen sind 100%ig richtig, könnte man natürlich nicht ernst nehmen, aber daß man generell keine Aussagen, Tendenzen usw. darstellen kann, ist genauso falsch!!!
Wenn Du so eine Analyse machen willst mußt Du das meines Wissens den Usern auf der Internetseite mitteilen(Datenschutz beachten...), und entsprechend mit Cookies und/oder SessionIDs dafür sorgen dass Du an vernünftige Daten kommst, und natürlich dafür sorgen dass das ganze vernünftig geloggt wird, nicht jeder Apache loggt seit eh und je cookies!
Meine obigen Aussagen bezogen sich nicht auf reine Logfiles, d.h. wir versuchen über Pixelmeßmethoden (JavaScript) noch an andere Daten zu kommen. Aber auch aus Logfiles wären Aussagen machbar, nur nicht so einfach, weil weniger spezifische Daten vorhanden sind.
Das muß man einfach klar sehen und so darstellen. Generell zu sagen, es geht gar nicht bzw. das, was man da statistisch darstellt, stimmt 100%ig, ist IMHO beides falsch.
Gruß
Reiner