基于AIS和Bayes网络的垃圾邮件过滤研究

来源 :长沙理工大学 | 被引量 : 2次 | 上传用户:wangjunhua66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今电子邮件已经成为人们日常生活中通信、交流的重要手段之一,但电子邮件在为人们提供极其方便的通信手段同时,垃圾邮件的危害也日益严重,网民平均收到的垃圾邮件数量已经超过了正常邮件。因此,如何解决好垃圾邮件的过滤问题是一项有着重大现实意义的课题。人工免疫系统强大的自体非自体识别(免疫识别)能力是垃圾邮件识别“天然”的解决办法,灵敏的免疫反馈机制为识别多变的垃圾邮件提供了解决之道。如何将人工免疫系统的这些仿生机制,应用于垃圾邮件过滤,是本文将要解决的主要问题。本文首先分析了电子邮件的工作原理、垃圾邮件的危害及过滤研究现状,并对垃圾邮件过滤的常用语料库,和垃圾邮件过滤方法的评价体系做了介绍。在分析现有垃圾邮件过滤技术的基础上,尝试将人工免疫系统和贝叶斯网络相结合应用于垃圾邮件的过滤。其次,分析了人工免疫系统和贝叶斯网络的基本原理。对人工免疫系统,不仅分析了它的仿生机理,还给出了免疫算法的基本架构,和常用的基于群体的免疫算法;对贝叶斯网络,给出了基本的贝叶斯公式,分析了贝叶斯网络的拓扑结构,和条件独立性假设。最后,设计了一个基于AIS 和Bayes 网络的垃圾邮件过滤算法,分析了其中的关键问题,并给出了解决办法;在此基础上设计了一个基于AIS 和Bayes网络的垃圾邮件过滤模型,并以此模型为基础设计了一个垃圾邮件过滤仿真器;最后在PU1 Bare 语料上做了垃圾邮件过滤仿真实验,并取得了较好效果。
其他文献
本学位论文研究了基于人工神经网络的手写体朝鲜文字脱机识别方法.朝鲜文字系统的文字数量庞大、相似文字多、手写体文字形变复杂、兼具西文单词和汉字的特点,同时又具有自身
WCDMA核心网从R4版本开始引入了软交换技术,在R99版本的基础上对电路域进行了彻底地改造。R4网络将控制面与承载面分离,使原来的交换机概念从逻辑上划分成MGW和MSC服务器。其
数据挖掘是从大型数据库或数据仓库中挖掘隐含的、未知的、非平凡的及有潜在应用价值的信息或模式的过程。数据挖掘获得的规则包括描述型规则和预测型规则,特征化规则是一种
入侵检测是网络安全技术的一个重要组成部分。现在大多数的入侵检测算法都是有监督的——使用带标签的数据样本进行训练。而无监督入侵检测算法——使用无标签的数据样本进行
入侵检测是目前研究最多,应用最广的安全技术之一。入侵检测即识别出(最好是实时)对计算机及网络系统的非法的和未授权的使用、误用和滥用。我们可以把这个识别过程看成是一个
随着信息技术的飞快发展,网络的出现给我们的生活带来了极大的便利,通过因特网,人们可以了解新闻,获取信息,玩网络游戏。无线传感器网络作为近年来网络信息技术的一个研究热
随着数据库的操作过程越来越复杂,在对数据的一系列操作中引入了工作流技术,可以按照事先设计好的操作流程,自动执行对数据库中数据的操作,产生了面向数据库的工作流。在面向
移动通信网络规划和优化是一项复杂的系统工程,它涉及到频率资源、无线网络、用户分布等问题,没有固定的模式。小区规划是移动通信网络规划和优化的基础步骤,对节省网络建设成本
随着计算机网络的飞速发展,传统的集中式网络测量系统面临着多供应商、多种技术异构网络的测量而暴露出了它的不足。首先,当网络规模增大时,用于传送测量命令或测量结果的短
高分子科学是一门比较年轻的、学科间高度交叉、高度融合的新兴边缘学科,进行高分子科学的研究具有越来越重要的意义。通过计算机模拟是高分子合成研究的一种重要的手段,网格技