基于多规则的垃圾邮件过滤技术的研究与实现

来源 :四川大学 | 被引量 : 0次 | 上传用户:zhang5832
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的越来越普及,电子邮件正成为一种最快捷、最经济的通信手段。但是,在用户接收到有用的邮件的同时,各种各样的广告邮件、邮件炸弹以及邮件病毒等都不请自来的充斥着用户的邮箱,使得用户不得不花费大量的时间和精力来处理这些垃圾邮件。此外,这些垃圾邮件在互联网上不分昼夜的大量传输造成了邮件服务器拥塞,降低了整个网络的运行效率,给邮件服务提供商们带来了很大的损失。所以,如何准确的从大量邮件中寻找到所需要的有用邮件,减少垃圾邮件的干扰,已经成为无论是电子邮件提供商还是普通用户都很关心的焦点问题。因此研究开发垃圾邮件过滤系统变的极为迫切。 文章在对电子邮件协议进行深入剖析的基础上,首先讨论了主要的垃圾邮件过滤技术,包括:内容过滤技术、黑/白名单技术和SMTP认证技术。文章对各种技术的优缺点进行了阐述,并对垃圾邮件的过滤技术进行了小结。 接着探讨了垃圾邮件的数学描述,这是本文的重点部分。首先讨论了数学描述的基础,包括:垃圾邮件的发送机制、垃圾邮件的处理观点——“杂物论”、垃圾邮件的判断规则、规则表达式以及朴素贝叶斯模型,这些技术基础是数学描述的理论依据。接着本文在研究现有的各组织和政府部门定义的垃圾邮件的基础上,给出了自己的垃圾邮件定义和分类。垃圾邮件的定义是下一步进行垃圾邮件判断的基础和依据。最后给出了数学描述,分别对邮件的信头、信件主题和正文以及信件的附件进行了数学描述。 在数学描述的基础上,接着讨论了基于多规则的反垃圾邮件系统的研究与实现。本系统采用内容过滤和黑/白名单相结合的过滤技术,最终将一封电子邮件判断为:合法邮件、疑似垃圾邮件和垃圾邮件三个分类中的一种。四川人学硕士学位论文音春:基于多规则的垃圾邮件过诊技术的研究与实现给出了己实现的系统的详细设计,给出了各模块的接口以及流程图,最后提出了反垃圾邮件系统的辅助系统—动态黑名单,并给出了系统的测试结果。 本文的创新点在于对垃圾邮件的信头特征、信体特征等各种特征用数学方法进行了研究,并给出了垃圾邮件特征的数学描述,即给出了判断垃圾邮件的一种数学方法。值得一提的是,本文之所以对邮件的信体特征的数学描述分为信件正文(包括主题信息)和信件附件两部分是鉴于绝大多数垃圾邮件没有附件,那么在使用垃圾邮件特征的数学描述时,绝大多数情况下根本不考虑信件的附件。可见,将邮件的信体特征分成两个部分研究从逻辑上也更易理解。关键字:垃圾邮件数学描述内容过滤黑/白名单电子邮件协议
其他文献
PKI的主要目的是通过自动管理密钥和证书,可以为用户建立起一个安全的网络运行环境,使用户可以在多种应用环境下方便的使用加密和数字签名技术,从而保证网上数据的机密性、完
数字技术的发展带动了整个社会的不断进步,但数字化技术的发展同时也带来了“信息爆炸”。为了使信息更为方便的进行传输和存储,我们根据信息之间的相关性,去除信息冗余,对信息数
本文着重于无线传输环境中,在对H.264/AVC的联合信源信道编码失真分析的基础上,提出宏块编码模式的改进算法。研究工作可以概括如下:1)使用最小二乘曲线拟合的方法来验证H.264/A
图像压缩技术随着计算机网络技术和多媒体技术的迅猛发展而成为国际上热门的研究课题。小波变换是当前数学领域中一个迅速发展的新领域,它不仅有着深远的理论意义,而且具有十
cdma2000是第三代移动通信系统中最具有竞争力的标准之一,其基本形式cdma2000-1x为现有IS-95的改进形式,与IS-95系统完全兼容,同时又采用了许多新技术,能够真正意义上实现第
本文介绍并分析了基于密钥的分布式标签模型,这是一个新的信息流控制模型,它允许应用程序之间共享数据而又不会导致机密信息的泄漏。以前保护机密信息的方法是基于信息流的基础
本课题是对哈尔滨锐科光电技术有限公司的项目—工业与交通用监控光端机功能的扩展和完善。这是为改进同等功能的模拟光端机的缺陷和完善数字视频光端机的功能而研制的项目。
论文总结了数字电视和视频压缩标准的发展历史。详细介绍了本文所属国家“863”资助项目“HDTV SOC 平台”的相关背景,以及HDTV SOC 平台的系统构成和MIPS处理器在其中的地位
锅炉运行记录仪(锅炉黑匣子)系统主要用于自动监测锅炉故障的各种参数,实时监督可能发生的锅炉故障并记录故障发生的类型和时间。传统的记录仪系统基于RS—232串口通信,利用外
本文对卫星通信系统中的快速仿真方法做了大量深入研究,特别是针对我国近期航天测控技术发展的研究重点"跟踪与数据中继卫星系统(TDRSS)",在其关键技术星载用户全数字中频应