基于决策树算法的垃圾邮件通信行为检测过滤技术研究

被引量 : 0次 | 上传用户:zhongxinyi1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技进步和计算机网络技术的发展,网络彻底改变了人们的生活方式,越来越多的人融入到了互联网中,享受着网络带来的种种便利。但同时随着互联网规模的迅速扩大,许多问题已经成为互联网发展中无法回避的核心问题,其中垃圾邮件泛滥的问题尤为突出。本文在对传统的邮件过滤技术深入研究的基础上,以加快邮件过滤速度,节省网络带宽资源为目的,针对垃圾邮件发送行为特征,提出了相应的模型。针对传统的基于邮件正文内容的过滤技术扫描速度慢,占用大量网络带宽资源等问题,提出了通信行为检测的概念,结合数据挖掘技术,提出了一种基于决策树算法的垃圾邮件通信行为检测过滤方法。该方法把数据挖掘中的决策树分类方法应用到邮件过滤系统中,对C4.5算法进行了改进,使之更适合于大量的日志数据的快速处理。结合邮件日志数据特征,将其进行离散化预处理,降低连续型属性的影响,建立了一种基于信息熵理论的规则决策树,最后,利用剪枝处理技术对决策树修剪,克服了决策树处理数据中的速度慢,分支冗余等缺点。该过滤技术工作在网络会话层,在邮件内容数据发送前对其进行合法性判断,从而节省网络带宽资源,同时保证了高准确率和一定的召回率。经实验证明,该方法效果良好,可极大提高邮件服务器的邮件过滤能力。本论文提出的通信行为检测技术为反垃圾邮件提供了一个新的并且是行之有效的解决方案,具有广阔的应用前景。
其他文献
目的:探究心理护理在分娩中的临床应用,为临床提供参考。方法:选择来我院进行分娩的的产妇208例,按照随机数表法平均分成观察组和对照组,分别给予一般常规护理和在心理护理一
公元前3世纪,罗马力量开始崛起于地中海区域,在之后不到200年的时间里,席卷整个地中海区域,为罗马帝国的建立打下了坚实的物质基础。罗马后勤以第一次布匿战争为分界线,在此
银行全面介入资产证券化和可能产生的资本套利等问题,使相应的金融监管成为必要。巴塞尔委员会历时12年的资产证券化金融监管探索与举措,将随着新资本协议的全面实施对银行的
<正>全国人大代表、全国人大财政经济委员会副主任委员吴晓灵建议,应该建立普惠制的税收政策,引导县域金融机构将新增可用资金的一定比例
介绍了一种新型气动便携式同机刹车装置,它的性能灵敏可靠,使用方便,易于管理?还具有防盗功能。经现场使用获得一定的经济效益。
本文就高等职业技术教育中,计算机课程考核存在的问题进行了剖析,提出了以能力为导向,改革课程考核的具体方案。
大数据时代背景下,数据挖掘技术在电力企业发展中发挥越来越重要的作用。本文通过剖析数据挖掘技术,提出数据挖掘技术在电力企业中的应用途径,同时对电力企业的数据挖掘技术
本研究针对四川省攀枝花市金沙江干热河谷地区烤烟生长前期严重缺水,烤烟叶片小、油分差、产量低的现状,于2006~2007年在攀申烟叶农场开展了烤烟集雨节水灌溉及移栽期推迟试验
抗日民族统一战线是抗战取得胜利的基础之一,也是新四军胜利发展的重要法宝。从一定意义上说,新四军的光辉历史,就是她正确执行党的抗日民族统一战线政策的历史,因为新四军的
本文在对英语新闻标题和汉语新闻标题进行对比研究的基础上,探讨了直译、意译等英语新闻标题的汉译方法。