Skip to content

Spamtraining

Heute habe ich mein Webspace aufgeräumt, dabei ist mir aufgefallen das zwei meiner Mailkonten sehr viel Speicherplatz belegen. Das hat mich sehr stutzig gemacht, da ich normalerweise alle Mails, nach dem abholen, vom Server lösche und die beiden Konten theoretisch gar keine Mailadressen zugewiesen hatten. Die Konten waren nur für FTP gedacht, doch wie es scheint wurden dorthin alle Mails umgeleitet, die vor dem @-Zeichen nicht existierende Konten hatten. Seit September 2005 haben sich dort mehr als 8000 Mails angesammelt, die alle Spam sind.

Noch vor ein Paar Monaten musste ich ein paar Stunden investieren um Spamarchive zu finden, damit ich meinen Spamassassin trainieren kann. Dabei hatte ich haufenweise Spam auf dem Server, ohne das ich es wusste.

Nun habe ich die Mailkonten ausgecheckt(über Nacht), und das das Zeug viel zu schade ist, um in /dev/null zu landen, habe ich ein Mailarchiv erstellt mit dem man seinen Spamassassin trainieren kann. Dazu muss man die Datei runterladen, entpacken, in der Konsole ins Verzeichnis wechseln und folgenden Befehl ausführen:

foreach file (`ls | grep -v '*'`) \
sa-learn --spam --mbox \
end

Nach dem ich die doppelten Spammails entfernt habe, waren es nur noch ung. 3500 Mails, ist aber trotzdem viel ;-) .

Trackbacks

No Trackbacks

Comments

Display comments as Linear | Threaded

tobi on :

mmm, zu alte Spam könnte dem SA aber auch schaden... Immerhin ist auch diese Branche "on the move"

kalkin on :

Ich weiß nicht kann gut sein, oder auch nicht. :-)

Add Comment

Enclosing asterisks marks text as bold (*word*), underscore are made via _word_.
Standard emoticons like :-) and ;-) are converted to images.
E-Mail addresses will not be displayed and will only be used for E-Mail notifications.

To prevent automated Bots from commentspamming, please enter the string you see in the image below in the appropriate input box. Your comment will only be submitted if the strings match. Please ensure that your browser supports and accepts cookies, or your comment cannot be verified correctly.
CAPTCHA

Form options