【摘 要】
:
手机短信依靠移动性强、收发便捷、资费低等优势,已逐渐成为人们重要的沟通工具。手机用户数量的不断增加推着短信发送数量呈几何级数上升。垃圾短信的问题也因此突显出来,不
论文部分内容阅读
手机短信依靠移动性强、收发便捷、资费低等优势,已逐渐成为人们重要的沟通工具。手机用户数量的不断增加推着短信发送数量呈几何级数上升。垃圾短信的问题也因此突显出来,不仅对人们的正常生活造成了诸多的不良影响,还对公共安全和社会稳定造成了一定程度的危害。因此对垃圾短信准确过滤显得尤其重要。经过研究发现,现有的短信过滤技术存在一些不足;基于黑白名单的过滤技术显得过于简单粗暴,基于内容分析技术虽然准确度得到很大程度的提高,但在实现上也存在着复杂度过高、易导致信息网络阻塞等不足。研究发现基于内容过滤技术的不足之处在于计算能力跟不上,而不是方法不正确。针对上述过滤技术的缺点,本文详细调查分析了这两年飞速发展起来的云计算技术,发现其技术在伸缩性、可靠性、成本等方面具有非常大的优势。特别需要指出的是依靠它的高扩展能力可以把计算规模做到无限大,而且成本又非常低,故可以作为不错的计算平台。有这个基础,本文接着分析了现行基于内容过滤器所使用的算法,发现大部分方案是基于贝叶斯分类原理来实现的。经过研究贝叶斯分类算法基础,并做了大量相关实验,发现其可以在云计算平台上通过MapReduce编程模型来实现。本文主要工作如下:(1)深入分析正在使用的垃圾短信过滤的实现方案,对各过滤实现方式的原理及其性能做仔细分析比较(2)分析了云计算技术各种应用,重点对云计算的Hadoop开源实现方案中的MapReduce编程模型做深入的研究。(3)对于贝叶斯分类器的基础原理及相应的算法实现做了详细的研究,根据其算法特点提出了基于云计算的贝叶斯分类器方案。(4)基于开源的Hadoop的云计算实现方案构建了基于贝叶斯分类的短信过滤器,并对其实现做了详细的论述。
其他文献
随着校园网络规模的扩大、应用的不断扩展,网络架构日益复杂,迫切需要对校园网络实现实时的监控、及时的预警和综合的分析。网络监测预警系统是了解网络运行状况的有效手段,
在电商化的推动下,脚型三维数据的获取工作在鞋类定做领域占据重要地位。传统的计算机多视觉几何算法对三维脚型进行重建需要满足各种各样的条件,如要求脚上纹理明显(要求数
多媒体互动应用一直以来都深受人们的喜爱,它可以以一种趣味的形式让用户站在一个新颖的角度去体验日常生活中可能出现的事件,甚至是处于想象中的事物。我们开发的多媒体互动
本体映射旨在构建异构本体间的语义桥梁,以实现不同本体间的知识共享和信息交流。但是,随着本体应用的不断发展,本体规模也在不断壮大,当前出现了一类概念数量庞大、相互之间
随着论坛、博客和微博等网络媒体的快速发展,表达人们情感、态度和观点的主观性文本大量出现。文本情感分析,也称意见挖掘,就是对这些主观性信息进行有效地分析和挖掘,并进一
随着数据规模的急速增大,应用种类的极大丰富,个人用户和企业对信息的需求已经远远超过了原有平台的能力。越来越多的应用和平台,不论对企业级还是个人级用户都不堪重负,Hadoop平
特征提取是模式识别中最基本的研究内容之一,可以有效地缓解模式识别领域经常出现的“维数灾难”问题并对识别性能起着重要作用,它在生物特征识别、信息处理、文本分类等领域有
为了解决传统神经网络算法(如BP、RBF算法)中出现的局部极小、收敛速度慢等问题,文献[1]和文献[2]中作者提出了权函数神经网络的概念及其学习算法。权函数神经网络结构简单、
随着传统广播视频和新生网络视频数量的快速增长,如何从浩如烟海的视频中快速有效地检索到用户所需的信息逐渐成为多媒体技术研究领域的重要课题。传统的视频检索方法主要有
从视频和图片中恢复三维信息是计算机视觉领域里的一个基本问题,有着广泛的应用。例如,高质量的深度信息不仅可以直接用来重建场景的三维结构、辅助机器人导航,而且还能帮助