« 花粉症@実家 | メイン | 自宅サーバの消費電力 »
2005年3月18日
迷惑メール
カテゴリー: [情報技術]ITmedia エンタープライズ:手元に届いた「イマドキの日本語スパムメール」実例編 (1/2)
多いですよねえ,迷惑メール(スパム).
以前,迷惑メールが増えてきた頃,道楽でフィルタを書いたことがあります.
最近,いろんなメールソフトについている,学習させるタイプです.私は,Becky を使っているので,そのプラグインにしてみました.(既存の物の存在も知っていましたが,まあ道楽なので)
このあたりの文献を参考にして適当に作りました.まあ,こういう資料があるから,作ってみようと思ったんですが.
A Plan for Spam
Better Bayesian Filtering
しかし,分かち書きが,かなりいいかげんなので,非常に弱い^^;
判定材料となる言葉の抽出がへたくそなわけです.最初の頃は,結構うまく動いていたのですが,最近はよく間違えます...
ただ,私の作ったフィルタがへぼというだけでなく(まあへぼなんですが),原理的に無理なんだろうなと思うメールも最近は多いです.
例えば,極端に短いメールです.判別に使える情報が少ないわけで,必ずと言っていいほど判別できません.また,間違いメールを装った,いかにも普通っぽいメールも,取りこぼすことが多いようです.
典型的な,アダルト系の迷惑メールはけっこう効率よくはじいています.
逆に,必要なメールを迷惑メールと誤判定することもあるのですが,だいたいは,大量の広告が入ったメールです.メールマガジンなんかに多いですね.言い回しがそっくりなことが多いので,迷惑メールと区別できないのでしょう.
まったく使えないわけでもないとは思います.公開できる性能じゃないですけど^^;
でも,正直言って,迷惑メールよりも多いのが,ウィルス付きのメールなんですけどね...
ISPがフィルタを入れたので,「検知しました」というお知らせメールしか来ないのですが,そのお知らせメールが大量にやってきます.
Netsky ばっかりです.これも何とかならないものなんでしょうかね...
投稿者 shingo : 2005年3月18日 23:24
トラックバック
このエントリーのトラックバックURL:
http://isolinear.info/cgi-bin/mt/mt-tb.cgi/66