デジタリストBlog

« 前の記事 | トップ | 次の記事 »

2006年03月05日

ベイジアンフィルタリング型の迷惑メール対策「POPFile」

迷惑メールが毎日数十通来るのでこれまではOutlook 2003の迷惑メールフィルタを使っていたけれど、これだと迷惑メールの送信ごとにメールアドレスを変えてくるタイプのスパムに対処できない。そこで、ベイジアンフィルタリング型の迷惑メール対策ソフトを探してPOPFileをインストールしてみたら、その効果があまりに劇的なので驚いた!
http://www.forest.impress.co.jp/lib/inet/mail/antispam/popfile.html
http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_POPFileDocumentationProject

ベイジアンフィルタリング型はベイズ理論という統計学?確率論?的な手法を用いて送られてきたメールがスパムメールかどうかを判定するものだそうで、インストールしてみると各単語に対してスパムメールかどうかを判定するための点数付けを行ってくれる。たとえば僕のパソコンで受信するメールのうち「出会い」という単語について言えば、スパムメールと認定されたメールの全単語のうち0.09%がこの単語であって、逆にこの単語が出てくるメールの99.84%が迷惑メールだそうだ。「デジタル」という単語であれば、この単語が迷惑メールの中で使われる頻度は0.005%で、逆にこの単語を含むメールが迷惑メールである確率は63.17%らしい。このようにあらゆる単語に迷惑メールの確率をレーティングして、メールを受信するとそのメールを単語レベルで分析して迷惑メールであるかどうかを判定しているのだ。

このPOPFileは最初から高精度でスパムメールをフィルタリングしてくれるわけではない。最初はこのソフトはどんなメールが迷惑メールでどんなメールは普通のメールなのかを判断できないが、迷惑メールを受信するたびに「これは迷惑メールです」とソフトに教育してやると、次第にその迷惑メールと認定されたメールの中に含まれる単語から迷惑メールの傾向を学習し、以後に受信するメールを振り分けることが出来るようになる。僕の場合は最初から100通くらいのメールを教育してやったあたりから劇的にスパムメールの遮断率が高まり、今では99%以上の迷惑メールをフィルタリングしてくれている。

最初のインストールがちょっとややこしくて詰まってしまうことも多いらしい。簡単に言えば自分のパソコン内にメール受信専用のプロキシサーバを建てているようなものなのだけど、例えばウイルス対策ソフトと相性が悪いとか(僕はAVG+ZoneAlarmで問題なく使えていますが)、プログラムとOSが別のパーティションにあるとインストールできないとか、企業のようにネットワーク自体が管理者権限でセキュリティ設定されていると動かせないとか、いろいろ問題はあるみたい。だけど一度インストールしてしまえばこのアプリはバックグラウンドで動き続けて、ほとんどの迷惑メールを除外してくれるので、便利なものであることは間違いない。

なにより毎日何十通も送られてきていた迷惑メールに悩まされなくなったのはありがたい。しかも、このPOPFileは今も毎日迷惑メールの単語を分析して仕分け精度を向上させ続けているのだ。

Posted at 2006/03/05(日曜日)18:14

この記事を読んだ人はこんな記事も読んでいます

« 前の記事 | トップ | 次の記事 »

« 前の記事 | トップ | 次の記事 »