基于遗传算法和朴素贝叶斯分类的邮件过滤系统研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:cnzhchch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子邮件已成为人们日常通信交流的重要手段,然而垃圾邮件却成了当前的一个严重社会问题,因此,研究一种有效的邮件过滤系统具有十分重要的意义。当前基于内容分析的文本分类技术正逐步应用到邮件过滤技术当中,并成为当前研究的热点。其中朴素贝叶斯技术是基于内容分析的邮件过滤方法中的重要方法。本文利用遗传算法和朴素贝叶斯分类技术实现了一个中文邮件过滤模型,主要工作如下:(1)根据N-最短路径方法对中文邮件进行分词处理,利用空间向量模型在计算机中表示文本,然后进行特征提取。(2)基于朴素贝叶斯分类器原理,设计和实现了一个基于遗传算法和朴素贝叶斯分类器的中文邮件过滤模型,利用遗传算法对传统的朴素贝叶斯模型进行优化。在此基础上,提出一个计算邮件的发件人地址、主题和正文这三个重要组成部分在邮件过滤时所占权重的算法GBFT,以获得较高的邮件过滤准确率和查全率。实验结果表明该算法具有较好的性能。(3)利用贝叶斯分类器对邮件进行分类的一般过程是计算概率,通过将概率与阂值比较判断待检测邮件是垃圾邮件还是有用邮件。本文提出了一个通过利用阈值对检测结果的影响来确定阈值的方法,并通过实验得出了一个比较合理的阈值,提高了结果的准确度。
其他文献
随着微电子技术、计算技术和无线通信等技术的飞速发展和日益成熟,无线传感器网络被广泛应用于军事、环境等多个领域,但是网络的不安全性限制了它的应用,安全问题受到了越来越多
智能规划是人工智能研究领域近年来发展起来的一个研究热点,在动态环境中,为了处理变化了的情况,对于规划的修补要比重新进行规划有效的多。随着规划技术的不断发展,规划修补技术
随着各行业信息化建设的迅速展开,都希望能够快速的构建适合自身业务需要的信息化系统。J2EE作为一个新型成熟的分布式计算技术,已经广泛应用在很多领域,其可伸缩性、可扩展
聚类分析是数据挖掘的重要分支之一。由于现实分类往往伴随着模糊性,因此把模糊数学方法引入聚类分析,可望聚类结果更切合实际。本文简要介绍了模糊集合、模糊关系理论,以及基于
车载自组网(Vehicle Ad-hoc Networks,VANET)不需要任何预设的基础设施,由行驶中的车辆利用无线通信模块组建而成。随着人们对城市智能交通管理、智能交通辅助和车载应用服务方面
就最近几年的技术发展和国际市场趋势分析,智能手机无疑将是未来手机的主流发展方向。而在目前的手机操作系统中,Symbian一直占据着无人撼动的主导地位。另一方面移动平台3D
本文提出了一种基于视频信息的消防战例讲评系统并给出了系统的具体实现,该系统主要应用于消防救火领域,能够将地图、视频以及消防员扑救过程中的时间地点综合显示出来,形成
数字水印技术作为数字产品版权保护、认证、隐蔽通信等方面的一个崭新方法,近年来引起了人们极大的兴趣和关注,得到了广泛的研究和应用。本文首先介绍了图像数字水印技术的原理
随着无线通信技术的快速发展与移动终端性能的提高,移动自组网在军用和民用领域得到广泛应用,人们对于移动自组网安全性、可靠性要求随之俱增。因此,移动自组网的网络安全问题成
隐写术是信息隐藏(Information Hiding)的一个主要分支,它主要研究如何实现隐密通信。通过使用隐写技术,将秘密信息隐藏在可公开的载体中进行传送,掩盖了真正的通信目的和通信发