Quantcast

ham spam sa-learn

Previous Topic Next Topic
 
classic Classic list List threaded Threaded
3 messages Options
Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

ham spam sa-learn

Christoph Kukulies
Nachdem mir hier jemand sagte, daß das Bayesfilter (Spamassassin,
Amavis) sehr umfangreich mit ham und spam gefüttert werden muß
und auch, nachdem ich feststelle, daß scheinbar immer noch dieselbe
Spam-Mail immer wieder durchkommt und sich die tägliche Anzahl nicht zu
verringern scheint, habe ich also jetzt neben dem Anlernen auf Spam auch
noch mal einen größeren Job gestartet, der alle mein "guten" mails
nochmal als Ham vorgesetzt bekommt.

Jetzt mal eine Frage: es sind ca. 53000 emails, die ich im vorgeworfen
habe. Und der Job nudelt schon seit einer halben Stunde.

Zugleich hatte ich ganz vergessen, daß parallel dazu auch noch der
cron-Job läuft, der sa-learn mit spam macht, der aus dem Junk-Folder
geholt wird.

Ist das sa-learn multi-processfähig? Hat ja seine eigene (Berkeley-)
DB?. Dürfte also gehen, oder?

Wollte nämlich auch mal time sa-learn für ein paar Beispiele messen, um
ungefähr voraussehen zu können, wann der Job fertig sein wird.


Gürße

Christoph


Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

Re: ham spam sa-learn

Christoph Kukulies
Ah, interessant:

/tmp# time /usr/bin/sa-learn --ham 1488*
bayes: bayes db version 0 is not able to be used, aborting! at
/usr/share/perl5/Mail/SpamAssassin/BayesStore/DBM.pm line 208.
^C

Hätte noch etwas Geduld haben müssen. Hatte den Job abgebrochen und er
sagte mir, er habe von 50062 messages gelernt.
Und sa-learn scheint auch so schlau zu sein, daß es sich merkt, wenn es
schon eine Nachricht untersucht hat.

Kann den Job also getrost noch mal starten und er wird die restlich 3000
dann noch lernen, allerdings schalte ich den cron-Job im Hintergrund
jetzt ab, der könnte Ärger machen.

Grüße
Christoph


Am 27.02.2017 um 10:37 schrieb Christoph P.U. Kukulies:

> Nachdem mir hier jemand sagte, daß das Bayesfilter (Spamassassin,
> Amavis) sehr umfangreich mit ham und spam gefüttert werden muß
> und auch, nachdem ich feststelle, daß scheinbar immer noch dieselbe
> Spam-Mail immer wieder durchkommt und sich die tägliche Anzahl nicht
> zu verringern scheint, habe ich also jetzt neben dem Anlernen auf Spam
> auch noch mal einen größeren Job gestartet, der alle mein "guten"
> mails nochmal als Ham vorgesetzt bekommt.
>
> Jetzt mal eine Frage: es sind ca. 53000 emails, die ich im vorgeworfen
> habe. Und der Job nudelt schon seit einer halben Stunde.
>
> Zugleich hatte ich ganz vergessen, daß parallel dazu auch noch der
> cron-Job läuft, der sa-learn mit spam macht, der aus dem Junk-Folder
> geholt wird.
>
> Ist das sa-learn multi-processfähig? Hat ja seine eigene (Berkeley-)
> DB?. Dürfte also gehen, oder?
>
> Wollte nämlich auch mal time sa-learn für ein paar Beispiele messen,
> um ungefähr voraussehen zu können, wann der Job fertig sein wird.
>
>
> Gürße
>
> Christoph
>
>

Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

Re: ham spam sa-learn

Mathias Jeschke
Hallo Christoph,

Am 27.02.2017 um 11:02 schrieb Christoph P.U. Kukulies:

> Hätte noch etwas Geduld haben müssen. Hatte den Job abgebrochen und er
> sagte mir, er habe von 50062 messages gelernt.
> Und sa-learn scheint auch so schlau zu sein, daß es sich merkt, wenn es
> schon eine Nachricht untersucht hat.

[...]

Da dies hier ja die Postfix-Buch-ML ist, möchte ich Dich auf Kapitel
17.14 (Training mit SpamAssassin), verweisen, in dem Peer den Sinn (oder
eher Unsinn) des Lernens mit Ham/Spam erörtert hat.

Kurzum: Spare Dir die Zeit - die Ergebnisse werden wahrscheinlich nicht
befriedigend sein.

Viele Grüße,
Mathias.
Loading...