基于内容解析的垃圾邮件过滤技术研究

来源 :安徽理工大学 | 被引量 : 2次 | 上传用户:haitian001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子邮件因为其方便、快捷、高效等优点,已成为人们互相交流、获取信息的重要工具。然而,大量垃圾邮件的出现消耗了网络资源,并对网络安全造成了威胁,给用户造成了巨大的损失,因此,研究垃圾邮件过滤有着十分重要的意义。目前,基于内容分析的文本分类技术被引入邮件过滤技术中,并已逐步称为研究的热点。本文对基于内容解析的垃圾邮件过滤技术进行了深入研究和分析,指出了特征选择算法和贝叶斯分类方法的缺陷,提出了改进方法。特征选择作为基于内容的垃圾邮件过滤技术中的重要环节,对过滤的精度、效率及安全性有着重要的影响,通过分析和对比几种常用的特征选择算法,本文采用信息增益方法对文本特征进行选择,针对特征项之间条件独立性假设带来的严重特征冗余现象,引入粗糙集理论,利用求解属性约简的方法消除冗余,提出了基于粗糙集和信息增益技术的特征选择方法。实验结果表明,该方法具有可行性,能够有效的消除冗余,获得更具代表性的特征子集,从而提高邮件分类的准确率和过滤的安全性。分类器的好坏对过滤的精度、效率及安全性起着直接的决定作用,本文在分析和对比几种常用的文本分类算法的基础上,采用朴素贝叶斯方法训练分类器,并对朴素贝叶斯方法和贝叶斯网络方法进行了对比和分析,针对朴素贝叶斯方法条件独立性假设过于苛刻的缺陷,结合贝叶斯网络方法,提出了两级贝叶斯网络分类算法。同时,考虑到合法邮件被误判的风险,引入风险因子λ,提出了基于最小决策风险的两级贝叶斯网络分类方法,有效的确保了合法邮件在过滤过程中的安全。最后,给出了基于贝叶斯方法的邮件过滤模型,并完成了基于最小决策风险的两级贝叶斯网络方法的原型系统设计与实现。图20表7参43
其他文献
本文通过对荣华二采区10
期刊
本刊讯:经党中央同意,中共中央办公厅近日发出通知,要求各省、自治区、直辖市党委,各大军区党委,中央各部委,国家机关各部委党组(党委),军委各总部、各军兵种党委,各人民团体
中国钨资源不但贫、细、杂,而且钨矿磨矿过程中由于性脆,产生大量的钨细泥。如何减少钨细泥的产生,提高钨资源的回收率,一直是钨资源开发过程中急需解决的难题。本文从选择性
支架围岩稳定性一直是综放开采研究的核心问题之一,因此深入认识围岩运动规律,掌握支架对围岩的控制作用,对实现工作面安全高产高效具有重要意义。本文采用实验室相似材料模
目的:分析老年精神病患者住院常见药物及其临床治疗效果;方法:从我院2017年1月到2017年12月收治的老年精神病患者中随机选择110例患者为研究对象,统计患者药物治疗使用情况及
党的十六大之后,各级党组织把学习贯彻“三个代表”重要思想与学习贯彻十六大精神紧密结合起来,取得了显著成效。前不久,胡锦涛同志在新进中央委员会的委员、候补委员学习班
在制造业的发展成长过程中,滚动直线导轨副也得到了普遍的应用,其制动能力及刚度问题也越来越收到重视,研究其附加部件—钳制器的性能也显得越来越重要。为了促进我国制造技
一、前言rn随着科学技术的不断进步和发展,人们对物质生活和精神生活的要求也越来越高,电器的遥控已成为必然的发展趋势.故遥控器应运而生,以适应对大量电器产品统一控制,提
本文以液体火箭挤压式推进系统为研究对象,深入研究了基于Modelica语言的推进系统建模与仿真、故障模式库建设、故障注入、容错性验证以及故障识别等技术,研究结果为液体火箭
车辆排气系统与发动机和车体相连,它的振动是车辆NVH的重要指标,对车辆的舒适性和排气系统各组成部件及吊挂件的寿命都会产生很大影响。由于发动机在运行过程中产生的振动构成