Tom: User wiedererkennen?

Beitrag lesen

Hello,

da stellt sich erst einmal die rechtliche Frage der Datenspeicherung, die in einigen aktuellen Postings hier gerade ausreichend diskutiert wird.

Dial-In:
Solange passend dazu selber keine personenbezogenen Daten erhoben wurden, SIND DIE DATEN ANONYM und sie lassen sich legal nur mit staatlicher Hilfe auf einen Anschluss beziehen, noch nicht mal auf eine Person!

Internet-Festanschlüsse:
Anschlussinhaber mit fester IP haben diese Entscheidung selber getroffen und müssen damit rechnen, dass ihre IP logged wird, genauso, wie ein ISDN-Teilnehmer, der seine Nummer nicht unterdrückt. Wer anonymisiert surfen will, kann sich für 19,90 im Monat einen zusätzlichen DSL-Anschluss mieten oder über Anonymizer kommen. Die Mehrkosten dürften unter Berücksichtigung des Preises für Festanschlüsse nicht mehr ins Gewicht fallen. Oder man muss eben ins Internetcafe gehen.

Für die Praxis kann man mit der IP innerhalb eines engen Zeitfesnters sehr wohl Statistik betreiben.
Man muss als erstes diejenigen, die zu eine-IP-pro-Request-Anbietern gehören außen vor lassen...
Die Anbieter und deren Netze kennt man i.d.R. (noch).

Die anderen kann  an dann umsortieren. Im Log stehen sie sortiert nach Zeit. Man muss sie für die Auswertung über die IP und die Zeit sortieren. Dann kann man auch erkennen, wann man die IP nicht wieder demselben Anschluss zuschlagen darf (Zeitlücke), auch wenn er es vielelicht ist.

Ich habe Hagbard so verstanden, dass er feststellen will, wer wie lange auf einer Seite bleibt und welche Wege er geht...

Die Wiedererkennung über eine Lücke hinweg ist selbstverständlich für die Statisktik technisch  nicht mehr zulässig.

Was eine Lücke ist, muss man selber entscheiden. Eine Minute oder zwei, vielleicht 1440 Sekunden?

Dass man bei diesen Untersuchungen selbstverständlich Fehler erzeugt, ist klar. Es wäre aber ungewöhnlich, wenn alle VW-Mitarbeiter, die hinter einem Proxy sitzen, auf einmal ins Internet gehen würden, um eine einzige Seite zu besuchen. Dazwischen sind normalerweise zeitliche Lücken.

Ich kennne dies von der Agentur für Arbeit. Die haben meine Zeitung immer dreimal am tag gelelsen: morgens, mittags, nachmittags. Anhand der übrigen Header der Requests könnte man dann vermutlich erkennen, ob es sich um unterschiedliche Clients handelt. Die sind nicht immer alle gleich.

Wenn ich mit DEN Daten dann zu deren Admin dackeln würde und sage, "Ey Hans, guck doch mal, von wessen Arbeitsplatz die kommen können..." dann ist das der ERSTE Schritt, die Anonymität aufzuheben.

Ein harzliches Glückauf

Tom vom Berg

--
Nur selber lernen macht schlau