面向工业大数据存储虚拟化迁移方法研究

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:mt0078
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近半个世纪以来,在摩尔定律的支配下,信息技术呈现出了前所未有的繁荣景象,互联网技术也不断改革创新。根据IDC预测,当前形势下每年产生的数据量高达8ZB,到2020年这个数字将逐渐增加至40ZB,这预示着大数据时代已经到来。随着大数据对工业企业各种限制的不断突破,数据将会在工业产业链甚至跨产业链间,创造出高于现在数倍的产值。McKinsey曾对交通业、金融业等七大领域进行预测,数据每年创造的经济价值将高达四万亿美元,甚至有专家预测,当数据实现开放流通并逐渐成为生产要素后,人类社会将真正迎来工业互联网时代。通常情况下,工业企业的信息数据系统会包含多个不同的业务系统,并且每个业务系统也都包含有各自的在线系统、归档系统和备份系统。企业出于对成本的考虑,存储系统会把在线业务平台的数据迁移到后端的大数据平台,但是数据迁移的过程极为复杂,需要解决的问题也较多。在上述诸多问题中,本文主要研究其中的两个问题,首先将在线数据迁移至大数据平台的过程中,数据的迁移效率有待提高;其次,数据迁移至大数据平台后,平台的各个节点之间数据的动态迁移的系统开销有待降低。根据上述两个问题,我们分别提出基于任务调度机制的数据迁移方法和基于迁移开销敏感的迁移方法对问题展开研究:具体内容如下:⑴本文首先对MapReduce分布式架构、HBase数据库、HDFS分布式文件系统、Key/Value存储系统等关键技术进行详细介绍,并对PSO算法和ABC算法的基本原理进行了深入研究。⑵针对将在线数据数据迁移到大数据平台的需求,本文提出一种基于任务调度机制的数据迁移方法。为了对上述方法进行实验分析,我们使用了Hadoop架构进行实现,并通过与Hadoop默认的FIFO任务调度机制进行比较,验证方法的有效性。⑶对于分布式存储系统而言,数据迁移是实现不同节点之间动态扩展与弹性负载均衡的关键技术。如何降低迁移开销是提供商需着力解决的问题。现有方法大多是针对非虚拟化环境下的数据迁移问题,对于大数据环境下的分布式存储系统而言,这些方法往往并不适用。为应对上述问题,我们将数据迁移问题纳入负载均衡场景,并利用基于面积的迁移开销模型,提出一种以降低系统开销的数据迁移方法。⑷根据数据迁移策略的实现过程,我们利用Hadoop平台对数据迁移方法的有效性进行数据测试,并通过与其他方法或者系统自带方案的对比,对方法进行评价分析。
其他文献
相对于IP组播在解决部署、安全性、扩展性以及拥塞控制等方面遇到的困难,应用层组播在这些方面具有较大优势,因此近年来得到了较大的发展。人们提出了许多应用层组播模型,有些
近年来,分形在理论和应用方面都取得了重要进展,基于分形理论绘制的图案结构复杂,色彩斑斓,变化万千,给人以震撼的美感,特别是广义M-J集分形图案已广泛应用于产品的包装和防
人脸识别技术凭借直观、非接触等特点,成为了生物特征识别领域的焦点,因此也积累了大量的成熟理论和算法。当前,在非理想条件下的人脸识别仍然存在一些不足,因此对非理想的条
近年来,随着人脸表情识别理论研究的深入和人机交互技术的发展,基于视频流的人脸表情识别技术已成为现阶段计算机视觉领域的一个研究热点。本文对人脸表情识别技术进行深入研究
互联网是由多个独立管理的域组成的网络,这些独立的管理域被称作自治系统AS。互联网上自治系统内部通过内部网关协议交换局部路由信息,如开放最短路由优先协议OSPF。自治系统
随着信息技术的迅速发展和互联网规模的不断扩大,互联网已经成为了全球最大、应用最广泛的信息库,如何有效检索这些海量信息成为当前研究的重要课题,因此信息检索(Information R
作为人脸识别系统的第一个关键环节,人脸检测在模式识别、计算机视觉和多媒体技术等领域中占据着日益重要的地位,因此,人脸检测逐渐受到研究者重视并且发展成为一项独立的研究领
随着无线网络的不断发展,以固定AP为中心的传统无线接入方式已无法满足人们大容量、高速率、强健壮性的无线通信需求;无线Mesh网的出现成为解决这些问题的可行方案之一。无线M
当今社会环境下,优秀的企业积累了很多历史数据,这些历史数据包含丰富的经验和知识。优秀企业会特别注重这些历史数据,因为历史数据中往往包含着某些重要信息和行业发展趋势,
随着计算机的不断普及发展,人们对计算机软件的需求不断变化,需求量也不断增长。然而随着软件的规模越来越大、结构越来越复杂,加之对软件生产方式、开发工具的研究目前还是