电子邮件过滤系统的研究与设计

来源 :中南大学 | 被引量 : 0次 | 上传用户:guanxming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为Internet上的一种重要服务—Email,给人们提供了一种重要的通信手段。但是,由于电子邮件原理上的缺陷,垃圾邮件日益泛滥,已经引起了人们的高度重视。邮件过滤技术已经成为当前研究的热点之一。 本文设计了一种基于Linux平台的邮件过滤系统,通过病毒扫描引擎清除邮件中的病毒,并采用基于向量空间模型的文本分类算法根据邮件内容对邮件进行过滤,从而防止垃圾邮件对邮件服务器和邮件用户造成不良影响。 论文首先研究了电子邮件的原理和相关协议,介绍了垃圾邮件的现状及其危害以及各种反垃圾邮件技术及其相关产品。接着论文详细分析了各种文本分类算法的特点,对向量空间法分类精度不高的原因进行了分析,从特征提取和权值计算两个方面对算法加以改进,有效地提高了向量空间法的分类精度,并将此改进的向量空间法作为论文所设计的邮件过滤系统的分类算法。论文分析了邮件过滤中所涉及到的邮件解码、邮件文本信息规范化问题,实现了基于停用词表的中文文本分词算法,并对向量空间法中的特征提取、权植计算和分类阀值的确定等相关问题进行了研究。 论文设计的邮件过滤系统采用多级过滤模型,实现了对邮件基于规则和基于信件内容的多级过滤,能够有效的区分正常邮件和垃圾邮件,具有较高的应用价值。
其他文献
自从分布式仿真系统诞生起,互联和重用就成为一个重要的研究课题。当今的分布仿真应用系统开发向大型化和复杂化方向发展,尤其是HLA标准的公布,为仿真系统的复用和互操作提供了
学位
首先本文在EAM专家意见和现场调研的基础上,通过分析大量EAM技术资料,整理并分析总结了EAM系统的特点以及其工作流程。对现行的设备管理模式进行了分析。其次根据领域工程的
本文作为国家自然科学基金资助课题“基于医学图像数据挖掘技术的研究”的一部分,对医学影像数据挖掘中的一些关键技术和主要算法做了深入的研究。针对乳腺影像数据库,提出了适
随着电信运营商通信和网络等技术设备的发展,窄带拨号和宽带ADSL 上网业务的开展和普及,国内计算机上网用户的迅速增加,网上业务已经成为电信持续发展的重要组成部分。如何在
本文主要介绍了在Windows环境下垃圾邮件过滤系统的设计模型和实现方法。该过滤系统能够对一些典型垃圾邮件进行识别判断过滤,而且也同时能够对其它邮件进行分类。经统计,从2
目前协同过滤算法以其简单和精确占据了推荐领域的半壁江山,许多网站都采用这种算法来进行推荐。然而它存在着冷启动、数据稀疏性等问题,也在寻找解决上述问题的突破口。当前社
随着计算机和网络技术的迅速发展,尤其是XML及其相关技术的发展和成熟,异构数据集成已逐渐成为研究的热点之一。由于XML无法较好地解决数据源间的语义异构问题,本文在XML技术
通讯网络中使用的设备,必须保证长时间可靠运行。在电信领域中,为了保证其高可用性、高处理能力和事务的连续性和完整性,网络服务器一般要求采用双机容错热备份系统,并且在主
随着宽带网的迅速发展和高速无线接入技术的发展,在IP网络上向用户提供集语音、视频、数据为一体的多媒体业务是通信网络发展的目标,其中视频会议是最典型的应用之一。本文在
近些年来,由于网络应用的爆炸式增长,网络安全的问题也越来越突出。网络安全模型高度概括了网络安全中的各个相关因素,为解决安全问题提供了理论依据,但由于TCP/IP协议本身的