【摘 要】
:
随着互联网技术的发展,电子邮件得到了广泛应用,但同时带来了垃圾邮件的泛滥。我国反垃圾邮件工作起步较晚,垃圾邮件在国内情况十分严重。常用的反垃圾邮件技术一般包括白名
论文部分内容阅读
随着互联网技术的发展,电子邮件得到了广泛应用,但同时带来了垃圾邮件的泛滥。我国反垃圾邮件工作起步较晚,垃圾邮件在国内情况十分严重。常用的反垃圾邮件技术一般包括白名单与黑名单技术;基于关键词匹配的内容扫描;基于HASH的垃圾邮件过滤与检查技术;基于内容的垃圾邮件过滤与检查技术以及其它,其中基于内容的垃圾邮件过滤与检查技术得到了最为广泛的应用。本文通过分析目前的各类过滤及检查技术特点,综合运用了基于IP过滤、信头过滤以及基于HASH等过滤与检查技术的特征,设计了一种基于特征向量及Bayes算法进行内容过滤的垃圾邮件过滤与检查系统,并对Bayes算法在垃圾邮件过滤与检查系统中应用的不足做了改进,提高了过滤精度。系统具有自主学习能力,通过不断训练能有效过滤垃圾邮件,具有较大的优越性。系统由协议代理模块,预处理模块,过滤模块,数据模块和主控模块组成,它位于邮件服务器前端,代替邮件服务器接收邮件,完成过滤与检查后,把邮件转发给邮件服务器,再由邮件服务器完成以后的功能。对于系统性能影响较大的是如何有效进行中文分词,本系统采用了基于互信息消除歧义的机械分词方法,并提出了一种改进的基于PATRICIA树的分词词典机制,从而提高了过滤效率。最后我们对该系统进行了测试,证明系统具有较高的效率及过滤精度,能有效实现了垃圾邮件的检查与过滤。
其他文献
本体——共享概念的明确的形式化规范说明,近年来受到信息科学领域学者的普遍亲睐,被广泛应用于知识工程、信息处理、自然语言理解及语义Web中。本体可以实现知识的共享和重
随着农业信息技术的快速发展,农业数据在快速积累和增加,对农业数据进行分类的需求也越来越多。如何将这些农业数据快速有效地转化为有价值的信息,是当前信息计算机技术领域
数据挖掘,也称为数据库中的知识发现,是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程,是数据库技术、人工智能、机器学习、统计分析、模糊逻辑、模
入侵检测技术作为一种保护方法对计算机网络安全起着重要的作用,将数据挖掘技术引入到入侵检测中,能够增强入侵检测系统对海量数据的处理能力,并使得入侵检测系统具有可扩展
作物生长模型是精准农业、数字农业和智能农业的重要支撑,近年来模型研究呈现出内容细致化、目标多样化和应用具体化等发展趋势。基于小样本数据的作物生长模型具有低耗、灵
开关磁阻电机调速系统(Switched Reluctance Drive,SRD)是集现代电力电子技术和控制技术为一体的典型的机电一体化系统,具有结构简单、坚固、成本低、工作可靠、控制灵活、运行效率高、适合于高速与恶劣环境下运行等优点。但是由于SRM电机本身是一个多可控量、强耦合的非线性系统,所以需要研究其控制方法,从而得到较好的调速性能。论文的主要工作如下:1、对开关磁阻电机调速系统(SRD)在
Ad hoc网络是一种工作在无固定结构环境下的自组织的无线移动网络。它适用于军事或是一些特殊应用场合,例如,战场上部队快速展开和推进、发生地震或水灾后的营救等。在没有网
随着信息化程度的不断提高,数据中心发生灾难而造成的数据丢失,会给企业造成巨大的损失,因此构建容灾系统对企业变得越来越重要。调查表明:总体拥有成本(TCO)过高是很多企业
动态二进制翻译器采用运行时翻译的方法来动态生成可执行代码,而传统调试器只能被用来调试静态生成的代码,所以传统调试器无法被用来调试运行在动态二进制翻译平台之上的可执
支持向量机方法已成为数据挖掘中不可缺少的一项技术,它成为近年来数据挖掘技术的新热点。现有的支持向量机大多速度较慢,无法适应实际应用。2005年Tsang提出的核心向量机(Co