基于SVM和D-S证据理论的垃圾邮件过滤技术的研究

来源 :桂林工学院 桂林理工大学 | 被引量 : 0次 | 上传用户:xianghh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,电子邮件以方便、快捷、高效、低成本的优势成为最受欢迎的网络功能之一,成为人们工作和生活中重要的通讯工具。由于随之而来的垃圾邮件数量多,具有反复性、强制性、欺骗性、不健康性或传播速度快等特点,污染网络环境,占用大量传输、存储和运算资源,影响了网络的正常运行,严重干扰了人们正常生活。因此,研究有效地治理垃圾邮件的方法是全世界共同面临的难题,也是互联网上待解决的问题。 支持向量机(SVM)是一种建立在统计学习理论之上的机器学习方法,已被成功地运用于许多分类问题的研究。本文基于SVM分类器出色分类性能对垃圾邮件过滤技术展开研究。 1.对电子邮件工作原理及垃圾邮件特征的分析,构建了垃圾邮件信头特征模型。本文提出了基于邮件信头特征及SVM的垃圾邮件过滤方法。 2.在学习、分析邮件信体内容文本预处理及特征提取方法的基础上,对性能较为稳定及有效的CHI统计方法进行了变形,将其评估函数变形规范化在[O,1]区间。应用基于信体内容的分类方法进行垃圾邮件过滤研究。 3.邮件的信头和信体内容都是邮件的重要组成部分,仅仅对其中一部分进行分析过滤得到的结果都不是客观的。本文提出了基于SVM和D-S证据理论的垃圾邮件判别模型,首次应用带概率估计信息的SVM分类器分别针对邮件信头特征及信体特征分类,首次采用D-S融合规则对信头及信体的分类结果进行融合,最终判别是否为垃圾邮件。 本文对以上垃圾邮件过滤算法分别进行了实验测试比较,实验结果证实了方法的有效、可行。
其他文献
当今电子商务市场发展非常迅速,形成了一个潜力巨大的市场,Internet上信息量和商务量爆炸式增长、网络环境日益复杂,以及产品供应商的不确定性都迫切地需要一种能够主动地、
高校教育对一个国家的生产力有着直接的影响,而一个国家的生产力又决定了国民生活标准和一个国家在全球经济中的竞争力。为了达到更高的教育目标,信息通讯技术必须得到最大程
概率论极限理论是概率论得主要分支之一,也是概率论的其它分支和数理统计得重要基础.而独立随机变量得概率极限理论又是概率论极限理论中教经典理论之一,在20世纪三四十年代已
入侵检测技术是保障网络安全的一个重要手段。随着网络规模的扩大和攻击方式的分布化,分布式入侵检测系统的研究成为热点。虽已有一些分布式入侵检测产品问世,但它们仍存在单
随着网络技术的迅速发展,互联网已经成为全球最大、最广泛使用的信息库,成为人们进行信息交流和处理的最有效平台。互联网上的数据是海量的,而且本身还以每天极高的速度增长,
随着社会各个领域计算机应用的普及,信息技术和网络技术高度发展,产生的数据量日益增大。如何有效地管理、利用数据库中数据,以及怎样才能发现其中潜在的知识,这就需要有新的、更
人工生命作为一个新的研究领域,其关于进化的研究是最基本和最重要的课题。它以生命现象为研究对象,以生命过程的机理及其工程实现技术为主要研究内容,以扩展人的生命功能为
为了使移动终端用户能够随时、随地访问网络,及时获取信息和资源,为这一群体用户提供网络信息访问服务有着明确的现实意义,能够为网站营运商带来丰厚的效益。由于移动终端和
随着网络技术的飞速发展,因特网上涌现出大量可以重用的服务,如何有效利用这些异构的服务资源搭建应用程序,成为软件工程的研究热点。以此为目的,研制了一种面向应用需求的异
自1996年SOA(Service Oriented Architecture,面向服务体系结构)概念的第一次提出到今天,SOA架构已经成为电子商务平台的主要模型。传统的电子商务平台没有将技术与服务相分离,