基于VSTO的垃圾邮件过滤系统的设计与实现

被引量 : 0次 | 上传用户:zjc823455041
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾邮件过滤是当前互联网应用中急需解决的一个重要课题,日益受到人们的关注。一般而言,垃圾邮件是指同一个发件人在同一时间将同一电子邮件寄往许许多多不同的用户,它的内容主要包括广告和一些政治宣传信件。如果经常收到这样的电子邮件,就会令人感到十分厌烦,而大量的信件更会扰乱电子邮件的正常使用。垃圾邮件过滤实际上是一类文本分类问题,朴素贝叶斯分类器是其中一种简单而有效的分类方法。该方法的不足在于它假定所有的属性是互相独立的,往往无法满足实际应用。但是,如果不作条件独立性假设,必然会导致组合爆炸。为此基于改进贝叶斯的垃圾邮件过滤算法已受到了越来越多研究人员的广泛关注。本文首先研究了垃圾邮件过滤方法和和相应过滤算法,比较了一些典型算法的优缺点,研究了电子邮件的发送和接收协议,分析了当前垃圾邮件过滤技术研究现状;根据电子邮件系统的工作原理,着重分析了基于贝叶斯网络的垃圾邮件过滤技术;结合相应实例,分析了朴素贝叶斯邮件分类的分类特点及精度。提出了客户端邮件过滤软件的缺失问题,基于此设计了一个客户端邮件过滤系统。最后基于VSTO结合Outlook实现了一个邮件自动过滤系统。该系统集成了手动规则、黑名单、白名单、自动规则、单机器学习过滤器、集成学习过滤器等多种过滤手段,主要在计算机客户端对收到的新邮件进行处理,使用已经被分类为垃圾邮件和合法邮件的邮件作为实验来源,并获得了相应的特征模式。再对该特征进行学习,从而实现过滤的目的。经测试,表明该系统功能齐全,过滤效果十分良好,其查准率≥95%,误拒率≤2%,误收率≤10%,具有很高的推广价值。其次,该系统还可以作为Outlook的过滤插件使用,能对Outlook收件箱中的邮件进行自动邮件过滤。反垃圾邮件的精确度和查全率一直是垃圾邮件过滤系统所要研究的重要方向,在以后的工作中还要继续在这方面加大研究力度,不断提高反垃圾水平。
其他文献
推导了同时考虑接触斑内刚性滑动量和弹性变形量影响的轮轨相对滑动速度计算公式;建立了车轮磨耗理论计算模型并发展了相应的数值分析程序,该计算模型中包含了车桥耦合动力学
大数据时代,宪法隐私权和私法隐私权同等重要。本文比较分析了美国、德国隐私权保护从传统隐私领域理论到信息隐私、信息自主权的演变,认同台湾学者将隐私权分为私密领域和信
近年来,随着人们越来越崇尚绿色健康的生活方式,植物蛋白饮料与茶饮料受到消费者的广泛喜爱。然而,饮料行业中同质化、品牌杂乱、价格战、缺乏创新等问题日益凸显,这要求企业
油菜是我国第一大油料作物,种植面积和产量均居世界首位,约占世界三分之一,年种植面积约1亿亩,年总产超过1200万吨,是我国继水稻、小麦、玉米之后的第四大农作物。目前,在我国的食
在新媒体技术发展和产业化运营背景下,新闻媒体对职务作品中的权利比重有了更高的要求。对此,《著作权法》修改草案将新闻职务作品作为特殊类型加以规定,使媒体、记者的权利
近年来,随着人们对智能材料——磁流变液认识水平的不断提高,以及精密加工和制造技术的快速发展,使得磁流变液在精密加工领域的应用越来越受到国内外专家和学者的关注。在相关领
归因,就是原因的归纳和总结。社会生活中人们总要对自己或他人的行为或行事的理由进行探究和归纳,以便以后更好地行事或更有明确的目的,这一推断总结的过程就是原因归纳的过程。
本文旨在探究政治卷入模式中政治知识、政治讨论、政治兴趣、政治功效感、党派意识各要素与投票行为改变的关联,以此检视政治卷入模式对于电视辩论效果的调节作用。基于对两
2011年,传播学者金姆和当代著名的公关学者詹姆斯·格鲁尼格提出了新的公关传播理论:问题解决情境理论。该理论模型主要由问题认知、受限认知、涉入认知和参考标准4个自变量,
世界各国为了保护消费者的利益,均制定出相关的食品法律和法规。中国政府亦十分重视食品卫生质量。早在1993年国务院颁布实施的《九十年代中国食物结构改革与发展纲要》中指出:要加