基于垃圾邮件检测及过滤技术的研究

来源 :决策与信息·中旬刊 | 被引量 : 0次 | 上传用户:herry
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]针对当前互联网上垃圾邮件,分析了其危害性及相关的处理技术。详细描述了目前垃圾邮件的处理方法,并分析了每种处理技术的缺陷。最后得出垃圾邮件处理要采用多种方法,综合治理的结论。
  [关键词]垃圾邮件;过滤;基于特征;基于内容
  网络时代的发展,给人们的生活带来极大的便利,作为现在网络在人们生活中的最广泛的应用之一,电子邮件(E-mail)以其安全可靠,快速廉价的优势逐渐取代传统的邮件形式,成为获取网络信息,沟通交流的重要渠道。但是,在正常使用的邮件的同时,几乎每个人都接收过各种各样的商业广告、非法宣传甚至反动信息,这给社会和个人都带来极大的危害。因此,如何将这些垃圾邮件在互联网上尽可能的减少,成了学术界研究的课题。
  按照中国电信《中国电信对边圾邮件处理暂行办法》的定义,垃圾邮件是指向未主动请求的用户发送的电子邮件广告、刊物或其他资料;有明确的退信方法、发信人、回信地址等的邮件;利用网络从事违反其他网络服务供应商的安全策略或服务条款的行为和其他预计会导致投诉的邮件。
  垃圾邮件的危害很大,主要表现在以下几个方面:1、垃圾邮件的泛滥对计算机存储资源及网络带宽都造成极大的浪费,有可能危害到正常的互联网使用。2、垃圾邮件作为病毒传播、非法商业宣传、不良信息等的主要传播载体对社会及个人产生极大的安全隐患。由于垃圾邮件具有强制接收、反复复制发送、地址欺骗及快速传播等特点,严重干扰了互联网正常秩序及个人的正常生活,少数别有用心的人,将垃圾邮件作为一个宣传阵地,对社会稳定带来极大的威胁。
  随着互联网的普及,越来越多的人在使用电子邮件,这也使得垃圾邮件的危害覆盖面更广。有研究表明,中国是世界上除了美国外垃圾邮件产生和接收最多的国家,形式迫使我们要对垃圾邮件进行围剿。
  目前互联网上针对垃圾邮件的过滤所采取的主要措施有:邮件收发服务器端及客户端的过滤、白名单及黑名单的过滤、基于邮件特征的过滤、基于内容的邮件过滤。
  邮件收发服务器端及客户端的过滤:用户的邮件收发的过程是:首先客户端经邮件用户代理(MUA,Mail User Agent)把报文送至服务器临时存储系统,并与服务器邮件传输代理(MTA,Mail Transfer Agent)建立连接,然后使用SMTP命令将报文传送过去(MTA过滤),邮件投递代理(MDA,Mail Delivery Agent)从MTA取得信件传送至最终服务器信箱(MDA过滤),最后MUA定期检查服务器信箱,并通知用户下载(MDA过滤)。
  但是无论是客户端的过滤,还是服务器端的过滤,都需要对邮件的各部分结构进行分析,才能得出是否垃圾邮件。
  白名单及黑名单过滤也是目前常用的一种垃圾邮件过滤方式。白名单中的地址所发的邮件,用户都认为是合法的邮件。用户可以根据需要来设置自己的白名单,这样可以防止有效邮件被误杀。黑名单则是最简单有效的垃圾邮件过滤技术,用户将黑名单地址所发的所有邮件认为是垃圾邮件不予接受。黑名单主要是对过邮件地址、所发送的服务器(IP)等相关信息进行识别。
  黑名单技术和白名单技术在实际使用过程中,存在着诸多技术上的缺陷。比如在实时黑名单中的查询中存在着较大的时间延迟问题,垃圾邮件及代理服务器ip地址欺骗等问题。使得过滤规则需要经常做出调整,既耗费大量时间,实际过滤效果又不足以令人满意,在使用中逐渐不能满足过滤要求.
  基于邮件特征的垃圾邮件过滤:垃圾邮件在发送的过程中,为了防止互联网的抵制,往往在发送过程中会采取相应的措施。而基于邮件特征垃圾邮件的过滤技术就是利用垃圾邮件的反制特征进行过滤。垃圾邮件在发送的过程中,往往会利用伪造地址,即在经过中间服务器时,修改其地址信息。我们可以分析其接收和发送地址及签名来分辨是否垃圾邮件。
  垃圾邮件为了其宣传效果最佳及利益最大化,往往会采取群发技术。通过监测是否大量的群发邮件可以进行垃圾邮件的过滤。如果一个邮件服务器在短时间内收到大量相同发件人的邮件,或者同一邮件服务器在短时间内收到内容相同的邮件,则基于特征的垃圾邮件过滤就会启动。
  在基于特征的垃圾邮件过滤中,对关键词的匹配是技术简单且可行性比较高的一种方式。在邮件传送过程中,可对主题及正文内容进行扫描,如果出现大量具有垃圾邮件特征的关键词时,如赚钱、免费、淫荡等等,则判定其为垃圾邮件采取过滤。
  基于邮件特征的垃圾邮件过滤,由于其技术相对简单,且行之有效,在实际应用中使用较多,但是这种过滤技术有时可能会造成误杀。
  基于内容的垃圾邮件过滤技术。以上所有的垃圾邮件的过滤方法都有其缺陷,再加上垃圾邮件发送者也在不断伪装和变更发送技术,给垃圾邮件的过滤造成了不少困难。于是基于内容的垃圾邮件过滤技术便产生了,通过对垃圾邮件的内容进行分类,从而检查出垃圾邮件。此技术是将信息过滤及文本分类相结合,来实现垃圾邮件的检测及过滤效果。其突出特点在于能跟踪垃圾邮件特征变化,并且可以自动获得垃圾邮件的特征,从而可以大提高垃圾邮件的过滤效果。
  综合以上种种情况,垃圾邮件处理是个长期的过程,在过滤技术上采取单一的过滤技术效果往往不好,而且可能造成误杀的情况。所以垃圾邮件的处理应该采取多种过滤技术相结合的情况进行处理,这样才能达到好的处理效果。
  参考文献
  [1]中国电信出台对垃圾邮件处理的暂行办法规范[EB/OL].http://www.people.com.cn/GB/paper39/1320/204610.html.
  [2]潘文锋基于内容的垃圾邮件过滤研究.北京:中国科学院计算技术研究所,2004.
  [3]王波,黄迪明.遗传神经网络在邮件过滤器中的应用电子科技大学学报,2005.
  [4]谭营,朱元春.反垃圾电子邮件方法研究进展智能系统学报,2010.
其他文献
本文定义的合伙文化是:合伙制会计师事务所(以下简称事务所)在经营过程中所形成的、被事务所人广泛认同的行为规则及其规则作用下的行为模式、行为特点、行为结果的总和,是一
[摘要]独立学院师资队伍的培养与母体学校相比存在着明显的不同之处,只有把握好独立学院师资队伍的自身特点,才能使学院在激烈的竞争面前得以生存并且不断发展完善。本文阐述了当前独立学院师资队伍的构成主要由学院自有的专任教师、母体学校教师(即本部教师)和外聘教师三部分组成,分析了三类教师自身的优缺点,并根据其自身特点提出了相应的培养方向。  社会声誉决定独立学院的生存,教学质量又决定着学院的社会声誉,而师
在体育课程中实施双语教学,是教学改革的新趋势.本文从大学生本身的外语水平、双语教学的概念入手,结合体育的特点,总结在普通高校体育课中实施双语教学的可行性、教学原则以
<正>国际所与国内所现有模式 的比较 根据调查,现有会计师事务所的"战略-绩效-报酬"系统可以分为三种模式:单链模式、复链模式、和介于两者之间的混合模式。 (一)单链模式 国
[摘要]利用钢筋混凝土结构来进行房屋的设计与建设是在现代的建设行业中比较流行的,主要原因是这种结构具备自己独特的优势,这些优势既包括了安全稳定方面,又包括了性价比方面,因此深得购房者和建筑商的偏爱。但整体的结构设计包括了多个方面,内容比较复杂,需要从框架的结构、荷载的计算等多个层级进行详细的研究,笔者根据自己多年的建设管理经验对钢筋混凝土结构的设计进行了下面的分析。  [关键词]房屋建设;钢筋混凝
今年年初,为对抗史无前例的金融危机,在成都海峡两岸科技产业开发园的组织下,8家刀具企业、30余家医药企业、50余家食品包装企业结成行业联盟,拧成一股绳,以兄弟联手的姿态抵
土地不仅是城市宝贵的自然资源,还是城市最具有活力、增值潜力巨大的国有资产,更是政府可以直接经营运作的高效资本.经营土地,是政府用市场的眼光看待城市土地资产,遵循市场
民营企业在我国经济发展中具有重要地位,但却遇到了严重的融资障碍,除了经济环境因素外,企业融资能力低下也是重要原因.企业向外传达偿还能力和投资项目的收益性等信息的能力
全球各国政府在逐渐摆脱衰退泥沼后,纷纷开始对其金融体系“查缺补漏”,无论是严格金融机构监管,还是开始向银行征税,都在不遗余力地展开对金融业的重建进程.目前,征收全球银
本文通过对荣华二采区10
期刊