976 Beiträge rss | 18 Nutzer online

Bayes Filter gegen Spam

Giesbert Damaschke bedankt sich bei Thomas Bayes, dessen Filter ihm zuverlässig eine Mail mit einer Grafik aus dem Posteingang gefischt hat.

Ich freue mich mit ihm über Bayes und seinen Filter. Diese Teile arbeiten schon irre gut.

Nun bin ich aber neugierig, wie diese von Giesbert zitierte Mail ins Netz des Filters ging. Unwahrscheinlich ist, dass der Filter auf den Inhalt der Grafik angesprungen ist, die für ein Medikament wirbt.

Ich glaube, dass der Filter auf diesen Textabschnitt reagiert hat, den Giesbert in seinem Eintrag zitiert:

Edinburgh cafe, is now believed to be the richest woman in Britain, worth an estimated $1 billion.

Hier haben wir schöne Begriffe, über die sich jeder Spamfilter freut: ein "richest", ein Dollarzeichen und vielleicht auch die Billion. Oh, und weiter oben steht auch noch "unemployed". Ich vermute mal, dass diese Wörter ausgereicht haben, um der Mail den Garaus zu machen.

[Nachtrag] Beim Lesen des Wikipedia-Eintrags über den Bayesian Filter ist mir auch noch diese Passage aufgefallen:

Allerdings bewertet der Filter auch HTML-Tags wie "img" und "src" negativ, so dass Bilder in E-Mails ein recht guter Hinweis auf Spam sind, ebenso wie die falsch geschriebenen Wörter, die vom Filter ja ebenfalls gelernt und natürlich mit einer extrem hohen Spamwahrscheinlichkeit bewertet werden.

Also wird wohl auch das eingebundene Bild gewirkt haben. Spannende Sache, so ein Filter :-)

Mehr dazu:

Aktualisiert am: 28.12.2011




Ihr Kommentar:


Name:


Copyright © goldmann.de 1999-2012   | Tippscout 5.0
Zurück Startseite