面向海量邮件过滤的云计算技术研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:liongliong437
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,全球范围内的垃圾邮件问题日益严重,不仅严重占用网络资源,威胁网络安全,更对人们的日常生活造成了严重困扰,给传统反垃圾邮件过滤技术带来了巨大挑战。云计算的出现和发展,打破固有模式,提出了新型的分布式并行编程模型和服务应用模式,为反垃圾邮件过滤课题提供了新的思路。本文选取贝叶斯邮件过滤算法作为研究对象,在深入研究了云计算在海量数据处理方面的核心技术之后,针对传统分布式贝叶斯算法实现中存在效率低、前期训练消耗资源大等缺点,对贝叶斯邮件过滤算法进行了改进,设计和实现了一种基于Hadoop开源云架构的贝叶斯邮件过滤MapReduce模型,还引入反馈学习机制,以适应垃圾邮件的不断更新与变化,提高垃圾邮件过滤的效率。实验结果表明,贝叶斯邮件过滤的MapReduce模型,在保持召回率、查准率和判对率等指标良好表现的同时,提高了过滤的执行效率。在对比不同角色的邮件过滤类型之后,本文采用位于MDA端的邮件过滤方式,并结合贝叶斯垃圾邮件安全性过滤MapReduce模型在Hadoop平台上的实现,设计出一种以邮件服务供应商为主要用户群体的SaaS云过滤服务模式。此模式包含应用业务层、云过滤层和硬件资源层,能为服务用户提供一种便捷、可订购、低成本、安全、可靠的邮件过滤功能。
其他文献
随着经济的飞速发展,人们对汽车的需求量不断攀升,交通事故的发生率也随之快速增长,安全驾驶也成为了社会关注的焦点之一。在所有的交通事故中,因驾驶员注意力不集中而造成的车道
互联网是海量信息资源库,随着大数据网络信息新时代的到来,信息量正以爆炸性的速度在增长,并且信息的组织是异构的、多元的和分布的,如何准确的在海量信息中寻找满足用户查询
当传统的C/S网络结构已经不能满足大众对文件下载的需求时,P2P在这种环境下运应而生,而P2SP技术是在吸收P2P、传统C/S结构两者优点的基础上发展而来,由于P2SP优点众多,已经从
车载网络是一种新的无线传感器网络,是智能交通系统的重要组成部分,在交通领域中发挥了重大的作用,尤其是在缓解道路拥塞、预防交通事故发生、车辆辅助驾驶以及车辆控制方面,有着
射频识别(RFID, radio frequency identification)是一种利用无线射频信号进行目标自动识别的技术,它具有无需人工干预、识别速度快、非接触识别等优点,随着射频识别技术的逐步发
随着计算机产业及互联网的不断发展,各行各业积累了海量的数据信息,图作为最通用的数据结构之一,在描述数据的属性及结构特征等方面具有显著的优势:一方面它可以描述生物、化学等
随着计算机网络和多媒体技术的迅速发展,数字图片等多媒体数据呈爆炸式的增长。处理和使用这些数据成为一个难题。图片检索、图片分割、物体检测以及协同图片分割等一系列的处
相似连接具有广泛的应用,如,合并检测,模糊的关键字匹配,数据融合,数据清理等。相似性度量方法有许多种,如Jaccard距离、Cosine距离、编辑距离。文章主要集中于字符串编辑距离相似
近年来,嵌入式以太网技术的不断发展使得嵌入式系统的应用领域日益广泛,同时也对嵌入式以太网的性能提出了更高的要求。尤其是在涉及到图像、视频、音频等大数据量传输的应用中
Android系统由于免费、开源、可移植等优点,在移动市场发展迅猛,成为占有率最高的操作系统。Android流行的同时,伴随着层出不穷的恶意软件。恶意软件可以窃听通话、窃取信息