- User-Agent-Header bekannter Bots. Bei vielen unbekannten Bots steht auch irgendwas mit "bot" oder "robot" drin.
Ich würde mich nicht darauf verlassen, dass nicht irgend ein Browser oder oder ein Proxy zufällig den string "bot" enthält :)
Da muss man höllisch aufpassen: Nachbarschaft (arsch) oder specialist (cials) sind Dinge die z.B. von Spamfiltern schnell mal als indiz herangezogen werden.
- Wer die robots.txt anfragt, ist höchstwahrscheinlich ein Bot.
Oder jemand der neugierig ist um zu erfahren, was Bots nicht lesen/indizieren sollen :) um es dann selbst zu lesen.
- Wer Formulare in Secundenbruchteilen ausfüllt und abschickt, ist so gut wie sicher ein Bot.
Oder jemand der mit automatisch ausgefüllten Formularen arbeitet (Opera kann das) und einfach nur den submit-Button klicken muss.