« 花粉症@実家 | メイン | 自宅サーバの消費電力 »

2005年3月18日

迷惑メール

カテゴリー: [情報技術]

ITmedia エンタープライズ:手元に届いた「イマドキの日本語スパムメール」実例編 (1/2)

多いですよねえ,迷惑メール(スパム).

以前,迷惑メールが増えてきた頃,道楽でフィルタを書いたことがあります.
最近,いろんなメールソフトについている,学習させるタイプです.私は,Becky を使っているので,そのプラグインにしてみました.(既存の物の存在も知っていましたが,まあ道楽なので)

このあたりの文献を参考にして適当に作りました.まあ,こういう資料があるから,作ってみようと思ったんですが.

A Plan for Spam
Better Bayesian Filtering


しかし,分かち書きが,かなりいいかげんなので,非常に弱い^^;
判定材料となる言葉の抽出がへたくそなわけです.最初の頃は,結構うまく動いていたのですが,最近はよく間違えます...

ただ,私の作ったフィルタがへぼというだけでなく(まあへぼなんですが),原理的に無理なんだろうなと思うメールも最近は多いです.
例えば,極端に短いメールです.判別に使える情報が少ないわけで,必ずと言っていいほど判別できません.また,間違いメールを装った,いかにも普通っぽいメールも,取りこぼすことが多いようです.

典型的な,アダルト系の迷惑メールはけっこう効率よくはじいています.

逆に,必要なメールを迷惑メールと誤判定することもあるのですが,だいたいは,大量の広告が入ったメールです.メールマガジンなんかに多いですね.言い回しがそっくりなことが多いので,迷惑メールと区別できないのでしょう.

まったく使えないわけでもないとは思います.公開できる性能じゃないですけど^^;

でも,正直言って,迷惑メールよりも多いのが,ウィルス付きのメールなんですけどね...
ISPがフィルタを入れたので,「検知しました」というお知らせメールしか来ないのですが,そのお知らせメールが大量にやってきます.
Netsky ばっかりです.これも何とかならないものなんでしょうかね...

投稿者 shingo : 2005年3月18日 23:24

トラックバック

このエントリーのトラックバックURL:
http://isolinear.info/cgi-bin/mt/mt-tb.cgi/66

コメント

コメントしてください

コメントスパム等の対策のために,大量のURLを含むコメント,古いエントリーに対するコメント,連続したコメントなどは,一旦保留されます.




保存しますか?