SpamAssassinのハム学習

もともとスパムはすべて英語メールで、英語のハムメールは少なかったのでSpamAssassinのヒット率はほぼ100%。最近user_prefsをちょこちょこいじって、要注意単語を増やしたおかげでスコアも安定的にスパムは20点を越すようになってきた。20点以上は自動的に削除してもいいかもしれない。

でも、はじめて誤認識があった。いらないけど一方的に送りつけてくるVisualWareのNewsletterで、これは個人的にはスパムなんだけどやはりハムである。そこで、ハム学習を行ってみる。

元のメールはスパム判定メールに添付されているので、スパムとして誤認識されたハムメールをHamboxに移動したら、添付されている実際のメールを同じディレクトリに保存する。自分のアカウントでログインしていることを確認したら、
$ sa-learn --ham /[自分のメールディレクトリのフルパス]/.Hambox/cur/ --dirとコマンドラインで打ち込む。すると、Learned tokens from 1 message(s) (1 message(s) examined)と応答が返ってきて、無事学習された。

さて、誤判定はこのように手動で正しい判定に直していくことによってしか修正できないらしい。なので、こまめにハム学習、スパム学習を行っていくしかない。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です