基于信息融合准则的邮件过滤系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jrff1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的垃圾邮件过滤技术是Internet安全技术研究的一个重点问题。将机器学习的相关方法应用于垃圾邮件的判定是进行大量垃圾邮件处理的有效方法。本文针对电子邮件的特点,通过分析传统邮件过滤技术的不足之处,在对大量垃圾邮件进行统计分析的基础之上,基于信息融合准则对邮件过滤技术进行了研究。本文主要包括以下几个方面的内容:1、综述垃圾邮件过滤问题的研究现状,包括垃圾邮件的定义、危害以及当前主要垃圾邮件过滤技术;在总结比较常用的特征提取方法及过滤算法的基础上,提出了一种利用期望交叉熵(CE)代替词频逆文档频率(TFIDF)算法中IDF函数进行分类的词频交叉熵(TFCE)算法。2、在深刻理解信息融合技术的基础上,通过理论分析,针对传统垃圾邮件判决采用单一准则的缺陷,重点研究了基于三角膜算子的垃圾邮件融合判决准则。其后详细阐述了该准则的原理和评价结果以及具体实现过程,包括体系结构、功能模型和组织模型、邮件过滤的流程和垃圾邮件反馈模块等问题。3、利用实验检验了算法的有效性。仿真实验主要分为两部分:一是比较了邮件过滤系统中各种基于评估函数的特征提取方法,如文档频率(DF)、互信息(MI)、信息增益(IG)、期望交叉熵(CE)、词频逆文档频率(TFIDF)和本文提出的新的特征提取算法词频交叉熵(TFCE)的优缺点和特征提取精度;二是将基于三角模算子的信息融合判决准则与基于词频或文档频率的采用单一准则的判决方法进行了比较。论文最后对基于词频交叉熵(TFCE)算法和信息融合准则的邮件过滤系统提出了进一步完善、改进的意见,从而得出最佳决策,有效降低邮件漏判、错判的概率,为邮件过滤技术的发展提供了一个新的探索途径。
其他文献
随着国民经济的不断发展,市场经济管理模式也逐渐产生了一定的变化.就经济管理形势而言,经济管理的传统管理方式早已无法满足当前经济发展趋势的管理要求,在日益激烈的市场经
认知无线电作为一种智能无线通信技术,能以第二用户身份实现与主用户频谱资源共享,通过提高频谱利用率缓解频谱资源与需求之间的矛盾。随着模拟电视向数字电视演进,TV频段释
在无线传感器网络日益广泛的应用中,如何在保证通信质量的前提下,降低节点的能量消耗,提高网络的工作寿命是一个非常重要的问题。路由协议是无线传感器网络的关键技术,对提高
具有创新、个性化的复合型和合作的能力,是新经济时代对人才发展的要求,给企业的人力资源管理也提出了新的挑战.在新经济时代,必须从营造创新文化、企业与人才同成长创新中寻
近年来,由于在应急通信和随遇通信(Ubiquitous Communication)方面显现出来的优势,使Ad Hoc网络越来越引起学术界和工业界的广泛关注和深入研究。随着Ad Hoc网络的迅速发展和多
超宽带(Ultra-WideBand,UWB)以其隐蔽性好、传输速率高、抗多径和窄带干扰能力强等优点,在短距多址高速无线通信中良好的应用前景而引起广泛研究。信道估计是超宽带通信系统
环行器作为一种重要的微波铁氧体器件,广泛用于通信与雷达系统中的收发信组件上。本文所研究的无源铁氧体带状线环行器有别于有源环行器,主要应用于基站等大功率器件中,需外加偏
水声目标识别是水声信号处理的重要环节。目前,自动识别技术有了长足的发展。但是随着研究的深入,发现了一些计算机无法克服的问题。例如在模糊判断领域,一些算法远远达不到
小波能有效地表示信号的零维奇异特征,由于小波的方向选择性有限,并且各向同性,其不能有效地表示图像的边缘、轮廓和纹理等几何特征。但对于二维图像,边缘、轮廓和纹理等具有
图像融合技术(Image Fusion Technology)作为多传感器信息融合的一个非常重要的分支,近二十年来,引起了世界范围内的广泛关注和研究热潮。图像融合主要在像素级、特征级、和