基于双隶属度模糊支持向量机的邮件过滤

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:wljb1213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的迅猛发展,电子邮件成为了现代通信的主要手段。但是同时,许多垃圾邮件也在网络中蔓延,给广大用户带来了大量的麻烦。垃圾邮件成为作为互联网上的一个日益严重的全球性安全问题,越来越得到社会大众和研究人员的重视和关注。因此能够有效地防治垃圾邮件是一个有重要意义的现实问题。本文研究了大量国内外最新反垃圾邮件文献和数据,对己有的垃圾邮件过滤技术做出分析、总结和展望。目前经常采用的垃圾邮件过滤技术可以分为两类,一类是基于规则的过滤方式。一般包括白名单与黑名单技术、规则过滤以及基于关键词匹配的内容扫描等。另一类是从电子邮件的文本内容入手,使用文本分类、信息过滤的算法,在训练邮件集合上学习垃圾邮件分类器。我们注意到,目前已有机器学习方法在进行垃圾邮件过滤时,一封邮件都是被确定地分类为垃圾邮件或者是合法邮件。但实际上,针对邮件服务器端的多个用户,一封邮件是垃圾邮件还是合法邮件,不同的用户有不同的认识,而且还有程度的问题,因此对邮件过滤的处理应被视为不确定信息的处理问题。在本文的研究中,针对邮件所含信息的模糊性和合法邮件与垃圾邮件错分代价的不对称性提出了基于双隶属度模糊支持向量机的邮件过滤方法。在确定样本的隶属度时,提出了一种新的有效地反映样本数据不确定性的隶属度函数来对邮件来计算隶属度,通过对每个样本赋予不同的双隶属度,得到双隶属度模糊支持向量机邮件过滤分类器。经仿真实验和相关方法的对比实验证明,本文所提出的邮件分类器能够有效降低将合法邮件误判为垃圾邮件,而且有很高的正确率等特点。
其他文献
面对信息时代海量数据的出现,如何有效地利用巨量的原始数据分析现状和预测未来,已经成为人类面临的一大挑战。由此数据挖掘技术应运而生并得以迅猛发展。目前,数据挖掘的主
随着通信网络技术的迅速发展,Internet得到了迅速普及。与此同时,各种新的业务需求如远程教育、电视会议、远程医疗的产生对网络带宽又提出了新的挑战,传统地面网络已不能完全满
随着社会的发展,人们的活动范围越来越不确定,这给移动定位业务提供了无限商机和挑战。越来越多的移动定位业务需要更高的定位精度和更短的响应时间。由OMA(开放移动联盟)提出
医学图像配准是信息科学、计算机图像技术与当代医学等多学科交叉的一个研究领域,已经在临床治疗与术前诊断中有了广泛的应用。但由于受噪声、图像细节畸变和模糊度等问题影
Internet已经在各个行业领域渗透日益加深,促使使人类的社会生活和工作产生了重大变革。现今市场对软件的需求越来越复杂、庞大,要求系统对行业的综合性越来越强,同时参与项
秘密共享是密码学的一个重要组成部分,为密钥管理提供了一个崭新的思路,在密钥的安全保存、传输以及合法利用中起到了关键的作用。利用秘密共享来保管秘密信息,一方面有利于
网格计算是以互联网和高性能计算为基础的一门新兴技术。网格作业管理是网格的最主要的功能之一,主要涉及到网格计算环境下作业的提交、调度和分配,资源的审核,作业的执行等问题
在中小型Ad Hoc网络中,DSR协议最为常用。DSR协议采用源路由机制,中间节点不需要存储路由信息,不使用周期性的路由通知,节约带宽并且减少功率消耗,具有高效的路由效率,但是DSR协议
移动自组织网络(MANET)是一种较为灵活的组网方式,它使得在任何地方,若干台具有联网能力的主机可以相互之间组成一个可以交互的网络。这种组网方式在军事、应急处理等需要团队
航空电子系统的发展经历了分立式、混合式、联合式和高度综合化四个阶段。在综合化航电系统中,各子系统之间相互联网通信,资源高度共享,存在巨大安全隐患。此外,综合化航电系统中