论文部分内容阅读
近年来,垃圾邮件的传播形式和内容已经出现了新的变化,其危害日益严重,而现有的垃圾邮件过滤技术却不能很好地应对这种形势。为了进一步提高互联网抵御垃圾邮件风险的能力,更好地满足用户对防范垃圾邮件的需求,本论文旨在基于垃圾邮件行为特征提出一种协作式垃圾邮件防范体系;研究基于蜜罐原理的邮件帐户评价选择机制,实现垃圾邮件样本的实时采集;研究规则共享与更新机制,实现规则联合推理与垃圾邮件协同防范。
本文具体的研究工作包括:
1.介绍现有的垃圾邮件过滤技术,主要对基于黑白名单的技术,基于统计的技术,基于规则的技术以及基于关键字的技术进行分析。总结其中存在的主要不足。
2.针对现有的分布式垃圾邮件过滤系统的不足,提出新的分布式垃圾邮件防范体系并给出其体系模型和工作机理,对体系结构中的功能模块及其主要功能进行描述和定义,在此基础上,对该系统的主要特点,即其协同性,快速免疫性和适应性进行了分析。
3.提出基于蜜罐原理的垃圾邮件样本采集方法,利用垃圾邮件的群发行为特征以及邮件帐户统计特点进行“疑似”垃圾邮件样本采集。引入蜜罐帐户评价公式,实现蜜罐帐户选择算法,动态地在电子邮件服务器中生成蜜罐集合,定期从蜜罐集合中采集“疑似”垃圾邮件样本并用特征集合的形式表示样本集,从而实现样本的实时采集,提高垃圾邮件过滤的实时性。
4.提出两级判断机制(一级判断和二级判断)。为了减少样本集的冗余,提高特征向量的准确度,本论文提出一级判断机制,利用特征向量在样本集中的重复度对其进行第一次判断,筛选出最新的“疑似”垃圾邮件的特征向量集。此外,二级判断是根据各邮件服务器识别垃圾邮件的准确度,以及特征向量在各邮件服务中的重复度,实现联合判断,计算出垃圾邮件特征的置信度,并淘汰掉置信度较低的特征向量,从而提高过滤规则的准确度,体现系统的协作性。
本论文最后完成了原型系统的设计与实现,对系统的主要功能模块及相关算法进行了测试和分析。