Alexander (HH): Browseridentifizierung (HTTP_USER_AGENT)

Beitrag lesen

Moin Moin!

  • libwww-perl/5.79
  • libwww-perl/5.805

Perls LWP-Library für Clients und ggf. auch Server. Noch ein User-Agent zum Selberbasteln.

Ich weiß das man diese Angaben auch fälschen kann, trotzdem interessiert es mich was hinter diesen Einträgen steckt...

Nichts, worüber Du Dir den Kopf zerbrechen müßtest. Ein ernsthafter Angreifer wird sich nicht mit "evil-bot/2.03" identifizieren, sondern aller wahrscheinlichkeit nach als halbwegs aktueller IE oder FF oder als Google-Bot tarnen. Ein paar blöde Automaten für die Suche nach angreifbaren Webservern identifizieren sich allerdings tatsächlich über den User-Agent.

Wer allzu blauäugig glaubt, dass jeder User-Agent mit Googlebot-Kennung wirklich von Google kommt, muß sich nicht wundern, wenn vom Server eines Tages nur noch rauchende Trümmer übrig sind. Google hat sehr genau dokumentiert, wie man den echten Googlebot erkennt: Über eine Rückwärtssuche der Client-IP mit anschließender Verifikation per Vorwärtssuche. Alle anderen "Googlebots" sind Lügner oder sogar Angreifer.

Bei FF und IE ist die identifikation leider nicht so einfach. Am besten geht man schlicht davon aus, dass im User-Agent-Header nichts sinnvolles drinsteht.

Wobei ich mich gelegentlich wundere, was so alles an Daten dort, gerade beim IE, zu finden ist. Aus einem Server-Log:

"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; AVPersonalSerial 33***c5f5dd***4751c631012f***5fe6f3***c3; .NET CLR 1.1.4322; .NET CLR 1.0.3705; .NET CLR 2.0.50727)"

Ja, da steht eine Seriennummer in der Browser-Kennung! Die Sternchen hab ich drübergetippt, im Original steht da die vollständige Nummer.

Jeder Bösewicht wird sich natürlich freuen, dass der IE so bereitwillig herausposaunt, welche .NET-Runtimes für Angriffe auf das XP-System zur Verfügung stehen. ;-)

Alexander

--
Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so".