Skip to content

Spamtraining

Heute habe ich mein Webspace aufgeräumt, dabei ist mir aufgefallen das zwei meiner Mailkonten sehr viel Speicherplatz belegen. Das hat mich sehr stutzig gemacht, da ich normalerweise alle Mails, nach dem abholen, vom Server lösche und die beiden Konten theoretisch gar keine Mailadressen zugewiesen hatten. Die Konten waren nur für FTP gedacht, doch wie es scheint wurden dorthin alle Mails umgeleitet, die vor dem @-Zeichen nicht existierende Konten hatten. Seit September 2005 haben sich dort mehr als 8000 Mails angesammelt, die alle Spam sind.

Noch vor ein Paar Monaten musste ich ein paar Stunden investieren um Spamarchive zu finden, damit ich meinen Spamassassin trainieren kann. Dabei hatte ich haufenweise Spam auf dem Server, ohne das ich es wusste.

Nun habe ich die Mailkonten ausgecheckt(über Nacht), und das das Zeug viel zu schade ist, um in /dev/null zu landen, habe ich ein Mailarchiv erstellt mit dem man seinen Spamassassin trainieren kann. Dazu muss man die Datei runterladen, entpacken, in der Konsole ins Verzeichnis wechseln und folgenden Befehl ausführen:

foreach file (`ls | grep -v '*'`) \
sa-learn --spam --mbox \
end

Nach dem ich die doppelten Spammails entfernt habe, waren es nur noch ung. 3500 Mails, ist aber trotzdem viel ;-) .