论文部分内容阅读
随着网络的发展和电子邮件的普及,垃圾邮件的数目飞速增长。大量涌现出来的垃圾邮件,不仅耗费了大量网络带宽和计算机时间空间开销,而且对用户的正常工作造成了严重的干扰。为了解决垃圾邮件问题,必须综合法律、技术等手段。然而到目前为止,相关的法律法规所起到的效果并不显著,我们能够依赖的主要还是用于邮件过滤的技术手段。
邮件过滤中需要避免的错误包括误判和漏判,而降低误判的概率更为重要。基于散列码的邮件过滤方法是现存方法中产生误判的概率相对较小的方法。为了在保持高效率地过滤掉垃圾邮件的同时,进一步降低误判的概率,本文在该方法的基础上,引入信任网络,采用信任值作为散列码分发、接受和拒绝的标准;并且通过对发件人信任值和邮件散列码的综合分析,对邮件进行过滤。
提出基于信任网络的邮件过滤方法之后,我们实现了核心算法(包括信任网络的建立和维护、散列码和邮件的分值计算等),并且建立了一个仿真环境来进行实验。在设置不同的系统参数,进行了较为全面的仿真实验之后,本文对实验得到的结果数据,包括误判和漏判的百分比、联系人的信任值和垃圾邮件散列码的分值进行了分析,并且与传统的基于散列码的过滤方法的数据进行了比较,从比较的结果来看,本文的方法与传统的方法相比,在有效性上近似(系统稳定后漏判的百分比都很低),而正确性则有了较大的提高(误判的数目大大减少)。