【摘 要】
:
电子邮件系统是目前互联网上最普及的应用之一。然而,电子邮件在给人们提供便捷通信手段的同时,也遭到了一些人为的滥用。当今垃圾邮件问题已经愈演愈烈,对互联网造成了很大
论文部分内容阅读
电子邮件系统是目前互联网上最普及的应用之一。然而,电子邮件在给人们提供便捷通信手段的同时,也遭到了一些人为的滥用。当今垃圾邮件问题已经愈演愈烈,对互联网造成了很大危害。目前,在打击垃圾邮件的技术中,基于贝叶斯算法的垃圾邮件过滤成为目前最有效的方法之一。贝叶斯过滤方法在分类的效果上有很大优势,因此逐渐被广泛接受。
本文主要研究贝叶斯算法及其在垃圾邮件过滤上的应用,其具体内容如下:
(1)对朴素贝叶斯算法进行了详细的研究,且提出了三个方面的改进思路。在文本表示方面,提出指纹特征的表示方法;在特征选择方面,提出了基于类条件分布的特征选择方法:在阈值判断过程,根据学习的不断深入性,提出了阈值动态调整算法。本文对这三个方面的改进,都进行了实验证明。
(2)分析邮件结构特点,从邮件结构不同于普通文本出发,提出集成加权模型。集成加权模型对邮件头和邮件正文分别建立模型,并通过加权方法集成二者结果,对垃圾邮件进行过滤。本文实现了集成加权模型,并且与普通模型进行了实验对比。
(3)研究了最小风险贝叶斯算法和主动学习贝叶斯算法这两种贝叶斯算法的扩展模型。最小风险贝叶斯算法能够减少正常邮件判为垃圾邮件的风险,而主动学习贝叶斯算法主动训练样本集,能够降低样本顺序对过滤精度的影响。
最后本文综合各方面的改进效果,设计了一个贝叶斯过滤器,并在标准数据集上进行测试。测试表明与经典的贝叶斯过滤器Bogofilter相比,过滤精度有较大的提高。
其他文献
近年来,网络视频数据量呈爆炸式增长,为更好地管理和利用数字视频资源,人们迫切希望计算机能自动完成对视频的标记及描述工作以代替费时费力的人工标注。然而,视频的高层语义,也就
当前,智能手机平台上的手机病毒已经对人们日常使用手机产生了不良影响,并且这种影响将日益严重。手机病毒侵犯了手机用户的个人隐私,导致了手机用户的金钱损失,严重损害了手
随着软件在我国航天领域中得到越来越广泛的使用,对软件的可靠性要求,尤其是在型号软件系统中,得到了越来越多的重视。软件失效将会带来巨大的经济损失,甚至会直接导致更为严
目前,数控系统的发展主要包括开放式、网络化、智能化等方面。其中,开放式是数控系统的一个主要发展方向。根据开放程度的不同,国外将开放式控制系统分为三类:1.人机接口开放
微机电技术、嵌入式计算技术和无线通信技术的快速发展,使得具有低成本、低功耗、体积小、扩展性强等特性的微型监测节点的出现成为可能。无线传感器网络由大量具有感知、计算
随着IP技术的飞速发展和信息化进程的不断加快,基于网络的应用服务变得越来越广泛。但是Internet以及网络技术的发展也使得网络入侵攻击变得更为普遍,数量和破坏程度也随之增
随着计算机网络的广泛应用和多媒体资源的丰富,P2P流量在互联网中占有越来越多的比例,新业务对网络的流量模型和应用模式都产生了重大影响。在这种情况下,研究并设计一个优秀
随着互联网的飞速发展,网络已经渗透到了与国计民生息息相关的方方面面,因此也就对信息网络的安全可信程度提出了越来越高的要求。风险评估(Risk Assessment)是指对信息和信息
随着计算机网络结构的日益复杂,以及大规模、分布式高速网络的大量应用,整个网络所面临的安全威胁日益严重,而攻击者的攻击手段越来越朝向自动化、复杂化的方向发展更加重了
随着半导体电子技术的飞速发展,嵌入式处理器和通用处理器的能力不断提升,嵌入式系统外设资源也逐渐丰富,嵌入式技术发展到以嵌入式操作系统为中心的第三阶段,各种用途和目的