基于人工神经网的中文垃圾邮件过滤器的设计与实现

被引量 : 0次 | 上传用户:q158166828
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的广泛应用,电子邮件服务已经成为人们必不可少的沟通和联系的工具,收发邮件已经成为网民使用最多的网络服务。然而,与日俱增的垃圾邮件也呈现泛滥的趋势。在每天超过十几亿的邮件之中,超过一半以上是垃圾邮件,这些垃圾邮件耗费了大量的服务器资源,同时也浪费了用户宝贵的时间进行相关的处理。更糟糕的是,在一些垃圾邮件中携带者一些计算机病毒,用户打开就会感染病毒,给网络服务提供商和用户都造成巨大的损失。因此,对于垃圾邮件的治理就显得尤为重要。目前,使用比较广泛的是垃圾邮件的过滤技术,根据邮件内容进行分类,通过文本分类的算法,从而决定该邮件是否为垃圾邮件;对于中文邮件,由于语言的特殊性,词与词之间没有明显的标记,导致中文邮件的过滤更加复杂。本文参考大量的垃圾邮件过滤方面的文献,对已有的垃圾邮件过滤技术进行分析和总结;根据BP神经网的特点:自学习能力,自组织能力,以及推理意识能力等,提出使用BP神经网作为文本分类的算法;结合ICTCLAS系统作为中文分词的工具,提高分词的精确性和稳定性;并且使用遗传算法来优化BP神经网,可以很好地解决神经网络容易陷入局部最小的问题,并且可以大大提高神经网络的学习能力;最终,通过使用以上的这些工具和算法,设计并实现一个针对中文垃圾邮件的过滤器。本文首先介绍了电子邮件的概念,以及垃圾邮件的一些相关知识;然后介绍并分析目前已有的垃圾邮件治理的一些技术;接下来介绍了垃圾邮件过滤相关的一些基本理论知识;最后,全面介绍了基于人工神经网的中文垃圾邮件过滤器的设计与实现的方案。
其他文献
针对传统的编程题自动评分方法没有考虑学生程序是怎样实现编程任务的,以及不能从程序文本的语法结构和语义角度衡量学生程序与正确答案的接近程度等问题,提出一种基于程序理解
对于科技创新在现代化进程中的巨大推动作用,学术界给予了足够的重视。但是,科技创新也具有严峻的两面性,它在推动现代化高速发展的同时,也在悄然颠覆人类传统的生活方式、生
本研究通过对3岁~6岁幼儿礼仪行为现状的调查和分析,发现不同性别的幼儿的礼仪行为在体态礼仪、语言礼仪、尊敬长辈礼仪、待客礼仪、公共场合礼仪这五个维度方面没有显著差异,
随着我国经济建设的快速发展,能源短缺已经成为制约经济健康发展的重要问题。建筑行业在施工和使用过程中,都会产生大量的能耗,在建筑行业推行设计节能,对于实现节能减排的可
我国高速公路规模的不断扩大,推动了高速公路事业的加速发展,促进我国经济的迅速增长,对于我国社会主义现代化建设具有重要的现实意义。高速公路的建设中,沥青路面会实行彩色
目的Wnt家族广泛地参与了生物胚胎的一些基本发育过程,以及成体细胞增殖、分化和凋亡过程。SFRPs(Secreted Frizzled-ralated Proteins)为分泌型蛋白质,全称为分泌型Frizzled相关
为了研究参与型体育消费者忠诚的影响因素与测评方法,在系统分析了国内外相关理论成果的基础上,采用文献法、访谈法、问卷调查法、统计分析法等,对福州市参与型体育消费市场进行
用最优化选择原则对有向赋权图中的最短路径问题进行了讨论 ,给出在任意简单有限有向赋权图中求出从任一点到指定点间的最短路径长度的数学模型 ,提出构造一条含弧数最少的最
板料成形技术是工业领域中最重要的一种金属加工方式。利用"分解-综合"原理,对反拉深成形工步进行工艺分析,在对预拉深成形型面进行优化的同时,改进了轮辐冲压成形工艺方案。基
本文主要介绍了新型节能墙体的特点、结构与材料,并通过对市场上存在的三种保温墙体的优缺点分析,突出新型节能墙体的优势,最后浅谈了我国节能墙体的发展。