Mit einem Referer-Filter gegen Kommentarspam

Mit einem Referer-Filter wollte ich gegen Logfile- und Kommentar-Spam vorgehen. Allerdings ging dieser Schuß nach hinten los – vorerst.

>>> Siehe auch: Referer-Filter gegen Kommentar-Spam.

(erschienen 2006 in Internet Professionell)

Aufmerksamen Lesern dieser Kolumne wird es nicht entgangen sein: Zur Zeit beschäftige ich mich mit Spam. Besser gesagt, ich muss mich damit beschäftigen. Wie in der letzten Ausgabe angekündigt, habe ich mir eine Referer-Sperrliste geholt, diese in meine .htaccess kopiert und damit versucht, Log- und Kommentar-Spammer auszubremsen.

Ich muss zugeben: Das hat gegen Kommentar-Spam nichts gebracht - lediglich der Logfile-Spam war damit einigermaßen gut eingegrenzt. Aber mit dem unbedachten Einsatz der Liste habe ich mir ganz andere Probleme geholt. Subtile, gemeine, kleinliche Probleme.

>>> Mehr: Generator für SpamAssassin-Filter-Ausdrücke.

Dem Ganzen auf die Schliche gekommen bin ich bei der täglichen Logfile-Meditaton: Einfach mit tail -f das Log vorbeirauschen lassen, bis sich ein Trance-Zustand einstellt. Mitten in der Trance bemächtigte sich meiner das Grauen. Immer wieder tauchte ein 403-Response-Code auf: Access Denied. Der Code ist an einigen Stellen zwar erwünscht - aber nicht beim Abrufen normaler Artikel durch normale User.

Der Fehler betraf immer nur bestimmte Seiten. Und darüber hinaus funktionierte auf diesen Seiten die CSS-Formtatierung nicht.

Lösung des Rätsels: Die URLs der betroffenen Seiten enthielt Wörter wie "analog". Erfahrene Spam-Bekämpfer sehen sofort, dass da ein böses Wort drinsteckt, auf das Filter zu 100% anschlagen. Ein Blick auf die Referer-Sperrliste bestätigte das Problem - sie filtert alles, worin die Zeichenkette "anal" vorkommt. Wird nun das CSS-File oder etwas anderes vom Analog-Beitrag aus hinzugeladen, steht "analog" im Referer und löst die Sperre aus. Ich habe die Liste erst einmal auf Eis gelegt. Vielleicht werde ich sie so umbauen, dass sie nur den Domainnamen des Referers überprüft.

>>> Weiterlesen: Assgen.php ist wieder da.

Filter gegen Spam

Immerhin hatte eine andere Maßnahme Erfolg gegen Kommentarspam: Ich habe einen simplen Filter eingebaut, der einen neuen Kommentar gegen eine Liste von Regulären Ausdrücken prüft. Trifft ein Ausdruck zu, wird der Kommentar zum Löschen markiert. Ich muss dann nur noch einmal klicken, um den ganzen Werbemist los zu werden. Erstaunlicherweise kann die Liste noch recht kurz bleiben. Mit "pills", "porn", "casino" sind schon geschätzte 80 Prozent aller Spam-Kommentare abgefangen. "poker", "backgammon" und "888" erledigen den Rest.

Ich bin mir sicher: Das wird nicht so einfach bleiben. Mit der Zeit werden mehr und raffiniertere Kommentare kommen. Einen Ausblick geben die mit Schlagwörtern kaum zu erfassenden Spam-Kommentare in meinen Blogs. Zum Glück bietet aber Wordpress einigermaßen wirksame Plugins, um dagegen vorzugehen. Uns Webmastern steht noch ein heißer und langwieriger Kampf gegen Kommentar-Spammer bevor.

Aktualisiert am: 13.08.2006



Ihr Kommentar:


Name:




Hinweis/Disclaimer