2012年8月2日 星期四

制作MailSpamAssassin规则的脚本

最好还是有大量的ham/spam样本,用mass-check等工具run一次,算出比较合适的分数再使用,xware老大贴的这个东西确实有效,但是分数的设置就不是最好的办法


[原创]制作MailSpamAssassin规则的脚本(非常好用)

日期:2006-06-21
作者:iceblood(刘宏光)
邮件:iceblood_at_163.com
网址:http://www.nettf.net/

MailSpamAssassin的规则写起来比较麻烦,所以写了一个脚本,专门来处理规则。
主脚本addspamrule:
代码

#!/bin/sh

#
# Add spam rule script
# compile by Liu Hongguang
# 2006/03/03
# Website: http://www.nettf.net

PAHT=/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin

//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
BODYFILE=body_spam.dat
SUBJECTFILE=subject_spam.dat
RULEFILE=livedoor.cf
RULENUM=500
DEFAULTHIT=2

DATE=`date '+%Y/%m/%d %H:%M'`
echo "#" > $RULEFILE
echo "# Create date: $DATE " >> $RULEFILE
echo "#" >> $RULEFILE

cat $SUBJECTFILE | awk -F\t \
'{
if ($1=="") next; #如果内容为空则跳过
if ($2=="" || $2<=0) $2='$DEFAULTHIT'; #当分数为空的时候则设置分数为默认的DEFAULTHIT
if (i=="")
i='$RULENUM'; #定义起始规则号为RULENUM
else
i++; #规则号自动加1
print "";
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
print "header CN_SUBJECT_"i" Subject =~ /"$1"/";
print "describe CN_SUBJECT_"i" Subject contains \""$1"\"";
print "score CN_SUBJECT_"i" "$2;
}' >> $RULEFILE

LINE=`sed '/^$/d' $SUBJECTFILE | wc -l | tr -d "\ "` #得到$SUBJECTFILE文件的行书
RULENUM=`expr $RULENUM + $LINE` #定义起始规则号不从默认的500开始而从新的开始

cat $BODYFILE | awk -F\t \
'{
if ($1=="") next;
if ($2=="" || $2<=0) $2='$DEFAULTHIT';
if (i=="")
i='$RULENUM';
else
i++;
print "";
print "body CN_BODY_"i" /"$1"/";
print "describe CN_BODY_"i" Body contains \""$1"\"";
print "score CN_BODY_"i" "$2;
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
}' >> $RULEFILE

echo "Done!"
exit 0

数据文件:body_spam.dat
代码

加盟热线 5.5
财税咨询 5.5
所有票据 5.5
广告发票 5.5
发票地税 5.5
定额发票 5.5
顺祝商祺 5.5
验证后付款 5.5
向外代开 5.5
发票代开 5.5
税率优惠 5.5
上网赚钱 5.5
多余发票 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
此信息长期有效 5.5
票据 5.5
对外代开 5.5
价书批发 5.5
邮件群发 5.5
增值税发票 5.5
招商热线 5.5
咨询电话 5.5
网络赚钱 5.5
可代开 5.5
挂网赚钱 5.5
注册香港公司 5.5
发票可以代开 5.5
人际网络 5.5
收税率 5.5
运输发票 5.5
域名免费 5.5
优惠代开 5.5
免费注册 5.5
税务发票 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
善意的邮件 5.5
主讲嘉宾 5.5
网络推广 5.5
香港公司注册 5.5
多余的发票 5.5
自助建站 5.5
现有发票 5.5
代开发票 5.5
网络营销 5.5
普通发票 5.5
eBay 5.5
财务咨询 5.5
行业发票 5.5
各种发票 5.5
可先验票 5.5
New software on our site 5.5
货到付款 5.5
票均为税 5.5
正规发票 5.5
以上票据 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
szjyyj.com 5.5
防卫用品 5.5
只选对不选贵 5.5
同样深受企业及劳动者好评 5.5
免费制作海报 5.5
采购功能及技巧 5.5
保税料件退换 5.5
凌云集团 5.5
fuqingyuan 5.5
抓住牛鼻子 5.5
提供图书署名服务 5.5
联茂电子科技 5.5
管理及营销人才参加 5.5
兼任上海企顾司 5.5
开利空调 5.5
e1858.com 5.5
赛博 5.5
澳门博彩业 5.5
中兴纺织 5.5
海关管理干部学院 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
电磁兼容设计 5.5
恒力制衣 5.5
江铃汽车 5.5
往返特价 5.5
机票业务 5.5
免费拥有 5.5
金度商贸 5.5
税务筹划操作专家 5.5
培训之家 5.5
實戰派講師 5.5
神龙汽车 5.5
授课生动 5.5
采购成本 5.5
郑州雅丽 5.5
电磁兼容 5.5
网上点击率 5.5
推销高手 5.5
会计进修学院 5.5
山天饮食 5.5
上海招聘会 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
企业销售 5.5
采购总监 5.5
采购主管 5.5
接通率高 5.5
税务经理 5.5
税务专员 5.5
策划总监 5.5
跟单员 5.5
总会计师 5.5
财务总监 5.5
经理等等 5.5
人事部门主管 5.5
企业总经理 5.5
医疗器械 5.5
生产部门经理 5.5
生产领班 5.5
培训经理 5.5
采购经理 5.5
质量保障人员 5.5
工厂老板 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
高层管理人员 5.5
营销策划 5.5
外贸业务 5.5
有色集團 5.5
合生 5.5
合 生 5.5
合-生 5.5
合*生 5.5
合-生-智-慧 5.5
广东省大型 5.5
精英在线 5.5
鼎韵科技 5.5
鼎 韵 5.5
鼎-韵 5.5
鼎*韵 5.5
道普 5.5
道 普 5.5
道-普-咨-询 5.5
道*普*咨*询 5.5
启致 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
启 致 5.5
盛 桐 5.5
盛桐 5.5
韦博 5.5
21cnhr.com 5.5
08865.com 5.5
普通展位 5.5
展位面积 5.5
特价机票 5.5
華   鷹 5.5
華鷹 5.5
才 经 管 理 学 院 5.5
才经管理学院 5.5
广交会 5.5
Visit our website 5.5
35expo.com 5.5
chinachr.com 5.5
askexpo.com 5.5
北鸣 5.5
创威 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
绝对是真票 5.5
bcpx.net.cn 5.5
培训费用 5.5
航空票务 5.5
机票特价 5.5
安 森 5.5
安森 5.5
顧 博 5.5
顧博 5.5
博林 5.5
企 业 培 训 5.5
futurecom.cn 5.5
dfit 5.5
bjroom.com 5.5
易腾 5.5
营销服务 5.5
wangjuan19821205 5.5
万科地产 5.5
30780628 5.5
cnstylish.com 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
0755zuche.com 5.5
6763.net 5.5
侨 鑫 5.5
兆 安 5.5
99cid.com 5.5
hr.net.cn 5.5
ZhaoPinYi.com 5.5
jober.cn 5.5
myproject.cn 5.5
91res 5.5
hrshi 5.5
days.net.cn 5.5
day123 5.5
斐捷 5.5
5i-training 5.5
lmqy 5.5
99cid 5.5
chinesehr 5.5
dagangweb 5.5
bxcfgjuid 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
洽谈业务 5.5
来电咨询 3
仟度科技 5.5
出口代理 5.5
代理深圳 5.5
兆安酒店 5.5
鲁能电力 5.5
VISIT THE SITE 5.5
visit the site 5.5
Our website 5.5
our website 5.5
- $ 5.5
普通国税 5.5
财.经.信.息 5.5
dhc.xazhenxing 5.5
sk55 5.5
t185 5.5
蓝 田 集 团 5.5
hyd123 5.5
waterSOS 5.5
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
watersos 5.5
yartin 5.5
ulticover 5.5
Falcon Energy 5.5
hl123 5.5
CGDC 5.5
C G D C 5.5
JUNE 22ND 5.5
in the field of your expertise 5.5
13802410641 5.5

数据文件2:subject_spam.dat
代码

特价机票 3
机票特价 3
Cum like a porn actor 5.5
Super formula power pack 5.5
代开发票 5.5

主脚本我就不多讲了,说说两个数据文件。
//文章出处:网络技术论坛(http://bbs.nettf.net) 作者:iceblood
以一行一个规则为最基本的添加方法。
前面为内容,后面有一个数字5.5,意思就是当抓到这样的字,就让评分+5.5,一般5就是垃圾邮件了,也就是说只要抓到这串字符就肯定为垃圾邮件。字符内容和数字之间一定记得是用<TAB>来隔开的,会看脚本的朋友应该从主脚本里能看出来。
同时注意数据的内容,不一定适合所有人,比如里面有“采购经理”,我们公司压根就没这个部门,也没有这个职位,所以我能把这四个字加进去。因为很多垃圾邮件都写采购经理收。
添加完数据文件运行./addspamrule,完成后会返回"done!"。


--------------------
多看、多学、多想、多做、多靠自己
把问题尽量留给自己,所有问题到我这里结束!

沒有留言:

張貼留言