复杂网络在垃圾邮件过滤中的应用研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:haibitian_lan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾邮件过滤是当前互联网应用中急需解决的一个重要课题,日益受到人们的关注。对于经常使用电子邮件的用户来说,垃圾邮件已经不是什么陌生的事物了。一般而言,垃圾邮件是指同一个发件人在同一时间将同一电子邮件寄往许许多多不同的用户,它的内容主要包括商业广告,以及政治宣传信件。如果经常收到这样的电子邮件,就会令人感到十分厌烦,而大量的信件更会扰乱电子邮件的正常使用。   垃圾邮件过滤实际上是一类文本分类问题,朴素贝叶斯分类器是其中一种简单而有效的分类方法。该方法的最大不足之处在于:它假定所有的属性是互相独立的,而这一假设在实际应用中往往无法满足。但是,如果不作条件独立性假设,必然会导致组合爆炸。为此基于改进贝叶斯的垃圾邮件过滤算法已受到了越来越多研究人员的广泛关注。   本文首先分析了现有典型的垃圾邮件过滤算法,并比较了一些典型过滤算法的优缺点;然后介绍了以贝叶斯方法为代表的基于内容的垃圾邮件过滤算法.最后对复杂特征网络的构建进行了综述,提出了一种基于复杂特征网络的分类器融合算法,该方法利用“边”(个体分类器输出的共现关系)的先验分布信息及个体分类器对新样本输出的共现关系信息,计算新样本属于各类别的后验概率,通过后验概率来完成特征信息的分类。事例表明,该方法能够有效地处理垃圾邮件的过滤问题。
其他文献
传统Internet仅提供“尽力而为”的数据报发送服务,面对网络上日益增长的多媒体应用,现有路由机制已经逐渐不能满足新的需求。如何实现路由协议的扩展,使其提供有效的服务质
密闭鼓风炉铅锌熔炼过程冶金反应机理复杂,具有变量多、非线性、时变、藕合严重的特点,难以用传统的数学模型描述熔炼生产过程。维持炉况稳定是提高锌产量和质量的基本保证。
随着越来越多开发人员将应用部署在云端,如何为应用程序提供一个稳定可靠的运行环境变得越来越重要,其中如何做好底层资源的调度和负载均衡则是一个不容忽视的挑战。在这个背
空值关系模型用来对关系数据库中暂时未知的、不确定的或模糊的信息进行表示和处理。由于关系数据库是建立在经典集合论与二值逻辑的基础之上的,当需要对含有空值的不完全数
计算网格作为网格技术最早也是最主要的应用,目前已成为国内外研究的热点。它最初的目标是通过互连网将超级计算机联合起来,解决复杂大型科学计算问题;现在,这一目标已演变为
随着越来越多高校校园网络建设的完成,如何合理有效的利用校园宽带网络,成为越来越备受关注的焦点。校园网络电视也应运而生,且正在逐渐成为校园网络中必不可少的一部分。电
本论文从某大学数字媒体和电视系统的实际需求出发,针对认证授权方面讨论如何保障可运营网络电视业务,设计实现了一套校园网络电视认证子系统。该认证子系统借鉴数字电视条件
分布式拒绝服务(DDoS)攻击是攻击发起者联合或控制网络上能够发动拒绝服务攻击的若干主机同时向被攻击者发起攻击的网络行为,为消除DDoS攻击对Internet潜在的巨大危害性,研究人
因特网与移动通信技术的高度融合,促进了移动电子商务的产生。由于无线信道的低质量和移动终端设备的限制,移动电子商务的安全问题变得十分重要并需要在实践中加以解决。因此
粗糙集是一种处理不精确、不确定数据的数学工具。经典的粗糙集理论是针对完备信息系统,进行数据分析和处理的,但在现实中,由于数据获取手段等条件的限制,大多的信息系统都是