Rogue Bots – Bots, die keiner haben will
Gestern Abend in meinen Logfiles Da zeigte sich ein Bot mit einem zufallsgenerierten User-Agent-String, etwa so:
84.180.94.116 – - [28/Nov/2005:21:20:53 +0100] “GET /Urlaub__kw.html HTTP/1.0″ 403 213 “-” “gmTTs ygpgqTrbosvamyoTuvj”
Der Client hat innerhalb von einer Sekunde 30 oder 40 Seiten abgerufen und hat sich dann wieder dünne gemacht. Jede Seite hat er mit einer anderen UA-Kennung abgerufen.
Das macht mich ziemlich sauer. Denn wenn das Beispiel Schule macht, können wir uns bald nicht mehr retten vor miesen Abgreifern, die Inhalte klauen und irgendwo anders unter ihrem Namen veröffentlichen.
Die IP ist übrigens eine dynamische IP von T-Online. Klar kann ich die sperren – aber was bringt’s? Denn der Abgreifer wählt sich einfach wieder unter einer anderen IP ein und fängt von vorne an.
Es bleibt nichts mehr anderes übrig, als ein System zu implementieren, das intelligent solche Angriffe erkennt und ausbremst, wenn nicht abblockt. Muss nur gucken, dass dieses System nicht zu intelligent wird und Googlebot & Co ausbremst.
Mehr zu diesem Thema:


Discussion Area - Leave a Comment