Cheatah: unnötige Leerzeichen in « » erlaubt?

Beitrag lesen

Hi,

ich kann mir gut vorstellen, daß die Auswertung nicht nur bekannte Strings einem Browser zuordnet - so eine Prozedur ist nämlich zum Scheitern verurteilt! Es werden einfach gewisse Stichworte genommen, anhand derer man etwas erkennen kann. Beispielsweise ist

Wäre es nicht denkbar, aus einer schönen großen Log-Datei ein Import in eine DB zu machen, wobei gewisse Signaturen zu bestimmten Browsern händisch zugeordnet werden. Diese DB könnte man, dann als Grundlage für die Idendifizierung verwendet. Und wenn ein "neuer" Browser auftaucht, dann könnte man diese Anmerken und wieder händisch zuordnen. Müßte so doch eine relativ komplette Liste bekommen, die einmal angelegt wenig Mühe macht sie zu warten.

Du hast offenbar noch nie versucht, HTTP_USER_AGENT auszuwerten... ;-)

Bei mir wird ca. jeder zehnte Pageview(!) von einem "neuen Browser", sprich einem neuen HTTP_USER_AGENT-String getätigt. Es sind dabei neben seltenen oder verstümmelten Strings vor allem immens viele Variationen möglich. Es kann alleine schon jeder Proxy oder Gateway seine eigene Kennung hinten anfügen (oder mitten rein, wenn er Lust hat), WebWasher & Co. tun das übrigens auch.

Wenn man dann aber doch eine Datenbank anlegt, hat man das Problem, daß jede neue Subsubversion eines Browsers bzw. das Auftauchen einer seltenen Browserversion mit einem seltenen Betriebssystem schon zu einem "unknown" führt. Mit einer Routine, die Browser und OS anhand von Symbolen erkennt, treten solche Probleme nicht auf. Bei geschickter Formulierung der Routine ist zudem die Wartung einfacher, weil man sich nicht durch tausende(!) von Zeilen schlagen muß - man hat einfach ein paar if-Abfragen, die man evtl. anpassen muß.

Nimm's mir bitte nicht übel, aber wer versucht, die USER_AGENTs anhand einer Datenbank zu erkennen, hat entweder extrem viele Besuche mit den verschiedensten Browsern, oder einen speziellen Grund (z.B. Vergleich logische Auswertung gegen Datenbank), oder einfach keine Ahnung.

Cheatah