邮件信息过滤算法研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:LJ619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的迅猛发展,在线的可用电子信息也迅速增加,电子邮件作为一种最快捷、最经济的通信方式,也得到飞速发展。但是同时,许多垃圾邮件也在网络中蔓延,占据了邮件服务器的大量存储空间,用户往往要花费大量时间去删除这些垃圾邮件。因此,研究邮件的自动过滤具有重要意义。邮件的自动过滤主要有基于规则和基于概率两种方式。基于概率的朴素贝叶斯算法具有方法简单、运算速度快、分类精确度高等优点,在文本分类中得到广泛应用。但是,在邮件过滤过程中,合法邮件被误判为垃圾邮件将可能给用户带来巨大的损失。传统的朴素贝叶斯算法在对邮件进行分类与过滤时,没有充分考虑到合法邮件与垃圾邮件具有的这一不同特性,因此用于邮件过滤时有一定的局限性。本文介绍了当前流行文本分类器的工作原理及其优缺点,分析了传统贝叶斯算法在邮件过滤过程中所存在的局限性,在此基础上,提出了基于最小风险贝叶斯邮件过滤算法,实验结果表明,该算法能在正确分类邮件的同时,减少合法邮件的误判率,在对垃圾邮件进行分类与过滤时具有较好的性能。基于上述算法,本文实现了一个邮件过滤器原型系统。
其他文献
计算机视觉中的“目标(Objects)”泛指图像中含有主要语义和视觉信息的若干区域,“似物性(Objectness)”是一种近年来提出地描述通用目标视觉共性的方法。基于似物性分析的目
分布式并行数据库系统(Distributed and Parallel Database System,简称DPDBS)是分布式计算、并行处理以及网络技术相结合的产物,其不但对分散数据具有较强的管理能力,同时具有
该文对于网上商店的分析包括顾客如何行动、需要什么和喜欢什么类型的系统模块.数据仓库和数据挖掘技术能帮助作者通过了解电子商务中的顾客、网络技术和商业处理工程来更好
并行视频服务器可将视频文件拆分存储于多个服务结点以达到为用户提供并行服务的目的.在确定系统的服务结构以后,仔细研究了视频文件的拆分方式以及拆分后的视频数据块的放置
在分析了QoS控制策略以及实现控制策略的多种QoS控制技术之后,针对当前的QoS路由机制做了详尽的探讨,引入了拥塞度的概念,提出了基于拥塞约束QoS路由的新路由算法.算法除了保
材料断裂破坏的数值模拟是一个多尺度难题。材料断裂研究在于回答两个基本的科学问题:裂纹何时形成;裂纹如何发展。对数值计算而言,裂纹相对于工程结构在空间尺度上至少小一个
传统企业网基于固定地点的专线连接方式,已难以适应现代企业的需求.于是企业在自身网络的灵活性、安全性、经济性、扩展性等方面提出了更高的要求.Internet的出现使跨地区的
学位
在分析现有虚拟专用网VPN(VirtualPrivateNetwork)采用的安全技术基础上,提出了一种新的安全机制.该安全机制针对当前VPN系统的效率与安全性能进行了分析与改进,实现了身份认
在大数据和“互联网+”应用的牵引下,中科院计算所提出3C融合和虚拟云服务下的未来移动通信网络体系结构——超级基站系统,采用“物理集中、逻辑分布”的资源池化共享技术,满足