Skip to content

Spamtraining

Heute habe ich mein Webspace aufgeräumt, dabei ist mir aufgefallen das zwei meiner Mailkonten sehr viel Speicherplatz belegen. Das hat mich sehr stutzig gemacht, da ich normalerweise alle Mails, nach dem abholen, vom Server lösche und die beiden Konten theoretisch gar keine Mailadressen zugewiesen hatten. Die Konten waren nur für FTP gedacht, doch wie es scheint wurden dorthin alle Mails umgeleitet, die vor dem @-Zeichen nicht existierende Konten hatten. Seit September 2005 haben sich dort mehr als 8000 Mails angesammelt, die alle Spam sind.

Noch vor ein Paar Monaten musste ich ein paar Stunden investieren um Spamarchive zu finden, damit ich meinen Spamassassin trainieren kann. Dabei hatte ich haufenweise Spam auf dem Server, ohne das ich es wusste.

Nun habe ich die Mailkonten ausgecheckt(über Nacht), und das das Zeug viel zu schade ist, um in /dev/null zu landen, habe ich ein Mailarchiv erstellt mit dem man seinen Spamassassin trainieren kann. Dazu muss man die Datei runterladen, entpacken, in der Konsole ins Verzeichnis wechseln und folgenden Befehl ausführen:

foreach file (`ls | grep -v '*'`) \
sa-learn --spam --mbox \
end

Nach dem ich die doppelten Spammails entfernt habe, waren es nur noch ung. 3500 Mails, ist aber trotzdem viel ;-) .

Trackbacks

Keine Trackbacks

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

tobi am :

mmm, zu alte Spam könnte dem SA aber auch schaden... Immerhin ist auch diese Branche "on the move"

kalkin am :

Ich weiß nicht kann gut sein, oder auch nicht. :-)

Kommentar schreiben

Umschließende Sterne heben ein Wort hervor (*wort*), per _wort_ kann ein Wort unterstrichen werden.
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.
Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.

Um maschinelle und automatische Übertragung von Spamkommentaren zu verhindern, bitte die Zeichenfolge im dargestellten Bild in der Eingabemaske eintragen. Nur wenn die Zeichenfolge richtig eingegeben wurde, kann der Kommentar angenommen werden. Bitte beachten Sie, dass Ihr Browser Cookies unterstützen muss, um dieses Verfahren anzuwenden.
CAPTCHA

Formular-Optionen