Stoppt den Kommentar-Spam

, Stand: 18.04.2007  Tipp druckenDrucken

Kommentar-Spam ist inzwischen mehr als nur lästig. Jeden Tag verbringe ich rund eine halbe Stunde damit, hinter Kommentar-Spammern herzujagen.

Bislang mache ich es denen aber auch zu leicht. Lediglich eine Stopwort-Liste filtert den Spam in Kommentaren und Foren. Dennoch kommen jeden Tag mehr und mehr unerwünschte Nachrichten auf die Server - die Wortliste reicht nicht mehr aus. Zeit, zu handeln.

Zwei Ansätze gibt es: Erstens den Spam von vornherein unterbinden, zweitens, den Spam nachträglich zu erkennen und auszublenden.

Der erste Ansatz führt über Barrieren, die ein Client nehmen muss, bevor er Daten an den Server senden darf. Dazu gehören die grafischen Captchas oder - im Sinne der Barrierefreiheit besser - einfache Rechenaufgaben, deren Ergebnis der User eintippen muss. Ebenso interessant: die Vergabe von Hash-Werten, die bei jedem Posting neu erzeugt und in einem versteckten Feld mit übergeben werden.

All diese Barrieren kann ein Spammer aber überwinden. Deshalb ist es wichtig, auch den Inhalt jedes Postings zu prüfen. Dabei könnte ich mir ein Scoring vorstellen - jedes Spam-Merkmal bekommt einen oder mehrere Minuspunkte. Ab einem gewissen Schwellenwert gilt die Nachricht dann als Spam.

Für das Scoring fallen mir folgende Kriterien ein:

- Anzahl der Links: Hat ein Post mehr als zwei Links, ist er verdächtig.

- IP-Blacklist: Die IP-Adresse des Posters mit einem oder mehreren RBL-Servern abgleichen.

- Toplevel-Domain: Nach meiner Erfahrung kommt viel Spam aus "ru", auch "my" (Malaysia) und "mx" für Mexiko sind reichlich vertreten.

- Server: Adressen wie tech-dns.net oder aceofspacedns.com hinterlassen Spam auf meinen Seiten. Auch die bekommen ein negatives Scoring. Leider gehen dabei aber auch andere Anbieter ins Netz, die sicher überwiegend normale User beherbergen, etwa routhost.com.

- Stoppwörter: Typische Begriffe aus Pornografie und Glückspiel lassen sich relativ leicht erkennen und filtern. Auch Tablettenklassiker wie Viagra, Cialis und so weiter gehören auf die Stopwort-Liste.

Jedes Spam-Merkmal bekommt einen oder mehrere Minuspunkte. Die zählt der Spam-Mechnismus zusammen und bildet daraus einen Gesamtwert. Überschreitet er einen Grenzwert, wird der Kommentar nicht freigeschaltet oder gleich gelöscht.

Das alles zu programmieren wird ein wenig Arbeit - aber sie kann sich lohnen und danach eine Menge Zeit sparen, die mir die Spammer stehlen.

Übrigens: In meinen Blogs stellt sich das Spam-Problem nicht. Hier verwende ich Akismet, das Spam sehr zuverlässig filtert. Für den Einsatz in kleinen Blogs ist dieser Service gratis.


Ihr Kommentar:


Name:


Aktualisiert am: 18.04.2007