基于Hadoop云平台的海量数字图像数据挖掘的研究

被引量 : 0次 | 上传用户:vince_yang_666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的数十年里,计算机与网络技术得到了飞速发展,极大地推动了社会各方面的发展。计算模式经历了大型机时代的终端-主机模式,个人计算机时代的客户机-服务器模式,以及目前互联网时代的浏览器-服务器模式,直到最近几年的云计算模式。云计算是一种新兴的计算模式,它是并行计算、分布式计算、网格计算的综合发展,以简单、透明的服务的形式提供无限制的计算资源。云计算的基本原理是将计算、存储及软硬件等服务分布在非本地的大量计算机构成的资源池上,用户通过网络获得相应的服务,从而有效的提高资源利用率,实现了按需获取,按时收费。虚拟化技术、分布式并行计算、分布式存储以及分布式数据管理是实现云计算的关键技术。随着图像获取和图像存储技术的迅速发展,使得我们能够获得大量有用的图像数据,如卫星遥感图像数据、医学图像数据等。图像数据挖掘就是对这些有用的图像进行分析并从中提取有用的信息。如何对这些日益增多的图像进行有效的存储和快速的数据挖掘,成为我们面临的最大问题。本文尝试利用Hadoop云平台来进行海量数字图像的数据挖掘。借助于Hadoop的分布式文件系统HDFS与分布式并行计算框架MapReduce,在现有的数据挖掘和数字图像数据挖掘的理论与技术基础上,来实现海量数字图像数据挖掘,可以解决上述的问题。本文具体完成了以下工作:1、总结了云计算的相关知识及发展历程,分析了Hadoop实现的开源云平台。对现有的数据挖掘与数字图像数据挖掘的理论与技术进行归纳和总结。2、设计了基于Hadoop的MapReduce并行计算框架实现数字图像并行化处理的键值对的类型,和数字图像文件的输入与输出格式。通过实验证明了基于Hadoop的MapReduce可以实现数字图像的并行化处理。3、设计了如何利用Hadoop云平台来构建海量数字图像数据挖掘的系统,并对该系统进行了展望。
其他文献
二十一世纪随着计算机科学技术的不断发展,计算机为电脑动画提供了越来越多的动画技术表现手段,这些新技术、新表现手法的不断推出,丰富了人们的视觉盛宴,使人们感受着技术手段的
唐代是我国中古时期最为繁荣、强盛的时代,其盛世文明的景象体现在礼乐制度的完善与服饰文化的包罗万象等方面。而燕乐作为大唐乐制中唯一能与雅乐相媲美且演出频率较高的乐舞
1998年房地产新政以来,我国房地产行业为国民经济的发展做出了重要贡献。但是,目前我国一线城市房价普遍虚高,对国民经济的发展带来了一定的负面影响。在这种情况下,研究影响房地
文章简述了现行经济适用房政策的可行性以及实施经济适用房政策的意义 ,并就经济适用房的建设提出若干建议
随着各行业的专业应用系统迅速增长,业务支撑网的应用模式也朝着大数据量、语音和高清视频相结合的方向发展。研究业务支撑管理系统如何真正管理好各个应用系统,是当前各业务支
在我国司法体制中,时常出现调解一词,它既会出现在公权主体中,还会出现在私权主体中,调解为各个利益主体提供了有利的资源和机会。然而,在实际调解过程中,存在司法活动混乱的
在国家对动画文化事业大力扶持政策的鼓舞下,中国动画正处于快速的发展之中,大量的动画片从大大小小的公司相继出炉,使得中国的动画片产量与日俱增成为动画产量大国,但遗憾的是却
发动机在使用过程中,一些零件因磨损、变形、破损、断裂、腐蚀和其他损伤而改变了零件原有的几何形状和尺寸,从而破坏了零件间的配合特性和工作能力,使部件、总成甚至整机的工作
线路截断阀由美国生产气液联动执行机构控制执行,它的维护保养逐渐成为设备管理工作中关注的焦点之一。目前,西气东输共有气液联动执行机构327台,根据维护保养工作中遇到问题