分布式存储

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:shenghuocc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着大数据技术的发展,新型数据中心的建设面临着投资规模、数据来源、信息安全等方面的挑战,该文提出了分布式存储建设方案,为基于大数据和云计算的新型数据中心建设提供新的模型。
  关键词:大数据;数据中心建设;分布式存储
  随着计算机技术和信息技术的飞速发展,人类已经进入大数据时代。什么是大数据?大数据指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。某种程度说,大数据是数据分析的前沿技术,其最核心的价值是在于对海量数据进行存储和分析。业界将其归纳为4个V——Volume(数据体量大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(价值密度低)。随着信息爆炸的到来,大数据时代引发了重大的社会变革。传统的数据中心已经无法适应大数据时代的要求,新型数据中心的建设面临更大挑战。如何适应新技术的发展、尽快实现数据中心建设对大数据应用的环境支撑,是当前亟待解决的问题。
  新型数据中心主要实现对大数据产品的支撑,包括基础数据汇总、数据计算、数据产品发布。其中,数据汇总是基础,数据计算是核心,数据产品发布是实现大数据成果的转化。为实现大数据的高效利用,数据中心应该将投入重点放在数据计算上,但基础数据的存储环境建设在传统数据中心建设中往往需要很高投人。如何解决这方面的矛盾,是新型大数据中心建设的研究主要方面。
  1数据中心建设面临的难点
  传统的数据中心主要以服务器为主,集中存储设备主要用于容灾备份,随着互联网技术的发展,网络产品深度开发,对数据分析的需求不断提高。作为数据分析的基础,数据存储量不断提高,需要大量的数据存储设备,传统的数据中心环境配置方案已经不能支撑当前飞速发展的大数据技术应用。由于本地存储能力不能适应不断增长的数据量,导致大数据计算能力无法体现,大数据的应用无法规模化。
  作为大数据建设的基础,新型大数据中心建设面临新的挑战。数据中心的建设存在以下几个难点:
  1.1数据中心的规模设计
  一个要承载政府级数据汇总和数据产品提供功能的数据中心,要将所需数据都存储在本地,规模要保证在大型数据中心的标准以上。而且,当今社会随着物联网、云计算技术的发展,数据量以前所未有的速度发展,数据中心的规模冗余计算是更大的挑战。如此大规模的数据中心建设面临着诸多困难。首先由于占地规模大,选址方案需要得到政府支持。制冷方案也需要探索,集装箱式制冷不适合,空气制冷成本太高,循环水制冷对于建筑群的统一制冷还没有标准。大型数据中心的运维监控系统建设和维护成本都很高。为适应大数据应用,新型数据中心需要研究新的设备配比方案,数据存储设备的比例需要大幅提高。另外,数据中心网络出口的带宽要求很高,提高了运维成本。
  1.2数据中心的数据来源
  更多的基础数据意味着更精确更高效的数据产品。数据来源多种多样,除了已有的传统数据,还有不到增加的物联网数据。数据格式也多种多样,文本、音频、视频数据等,尤其是视频数据在当今社会生活中使用越来越广泛。这些就对数据的存储需求提出了更高要求。传统的数据中心将各种数据存储在本地,数据的存储设备数量和冗余量都是巨大的,数据转移的时间和更新的速度也是影响数据质量的关键因素。
  1.3数据信息的安全
  环境破坏,将数据存储在本地,地震、火灾等物理破坏会造成无法恢复的数据丢失。信息破解,一旦本地数据管理员的信息被获取,所有的数据都将面临泄露的危险。网络破坏,对集中存储的数据网络出口进行攻击也将造成数据信息的整体破坏。
  2分布式存储
  根据以上关键问题和目前数据中心建设的技术现状,本文提出大数据建设的新的解决方案——分布式存储。
  分布式存储简单地说就是将数据分成若干部分,存储在不同的位置。分布式存储分为两种方式。举例说明,下面的表格数据按照分布式存储方式存储。
  如表1所示,同一行的每个特征数据是直接相关联的,而同一列的数据是没有直接关联性的。
  存储方式一,将具有直接关联性的信息存在相同位置,例如将辽河流域的水质信息存储在位置甲,形成数据表“辽河流域2016年第44周水质状况表”,如表2所示。
  而将海河流域水质信息存储在位置乙,形成数据表“海河流域2016年第44周水质状况表”,如表3所示。
  存储方式二,将具有直接关联性的信息分别存储。例如:将水系、点位名称、NH3-N(mg/1)、本周水质、上周水质、主要污染指标数据存储在甲处,将河流名称、断面状况、pH*、D0、c0DMn(mg/1)数据存储在乙处。分别以表4、表5的形式存储。
  3分布式存储的关键技术
  第一,异地数据传输。由于数据存储的位置分散,进行数据分析时要调取异地数据信息,因此对网络传输速率和可靠性要求较高。可以通过租用专线,并设计冗余路径实现。
  第二,数据编码。由于数据是分布存储的,并存储在多个位置,在异地调取数据时,为实现数据快速、准确的定位数据,需要对数据进行编码。数据编码需要进行统一规范。编码规则需要用尽可能少的字符实现唯一性和可扩展性。
  第三,数据安全。数据中心的安全措施需要合理部署。主要从以下几方面把握:异地数据传输通道部署编解码器等信息加密设备;区别本地数据管理和异地数据调用,设置不同级别的管理员权限;数据应用配置安全认证系统;数据中心的对外出口配置安全策略;编码信息和数据发布方案严格保密。
  3.1分布式存储在大数据建设方面的优点
  第一,分布式存储能有效降低硬件环境建设成本。目前,大数据中心多由政府投资,其中重要原因之一就是投资巨大。大数据建设需要大量的存储设备、高速运算计算机,这些设备的集中放置导致需要投入更多的环境建设成本,包括制冷系统、供电系统、显控系统等。分布式存储可以在已有的传统大、中型数据中心的基础上进行扩展。根据数据中心存储容量合理分配数据存储量。数据中心的核心区建设规模可以控制在中小型,大大减少了前期硬件建设投入。
  第二,分布式存储有利于数据的引接与更新。数据中心的数据维护主要包括新类型数据引接和已有数据更新两方面难点。集中式存储在新类型数据引接时需要增加存储设备、数据导人等工作;分布式存储引接新类型数据时在硬件方面只需要增加數据存储地与数据中心核心区之间的信道,数据不需要导入,只有完成数据编码就能实现数据利用。分布式数据存储数据有本地维护人员随时更新,而集中式存储的数据要及时更新需要投入更多的人力成本。
  第三,分布式存储的数据安全性更高。将数据存储在不同的位置,不同位置数据分别部署安全策略,同时设置多级管理权限,这种存储方式比将数据存储在同一位置更安全。而分布式存储的第二种方式比第一种方式更安全。第二种存储方式中,要想得到一条完整数据需要从所有数据的位置获取信息,还要取得数据编码信息,这就使人为窃取数据的难度非常高。
  4结束语
  大数据时代已经到来,新的机遇伴随新的挑战,提高数据使用效能,,实现数据产品的市场化,必须以数据中心建设为基础。新型分布式存储数据中心将投入集中在数据计算方面,在降低成本、提高数据使用率和数据安全方面具有突出优点。数据中心的建设还需要在实践中不断探索,在实际数据基础上形成新的数据中心建设标准。
其他文献
摘要:随着城市人口的不断增加,尤其是私家车的快速发展,城市交通拥堵问题日益凸显,已成为提升城市品质的难题之一。该文在具体分析盐城城市交通基础信息资源利用现状的基础上,就如何合理应用城市交通拥堵指数,缓解城市拥堵等问题进行了有益的探讨。  关键词:城市交通;拥堵; 指数;应用;分析  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)04-0223-02  1 研究背景
摘要:翻转课堂作为一种全新的教学模式在提高了学生学习主动性的同时,还培养了其自主学习探究的能力,非常适合中职教学。文章首先分析了翻转课堂在中职学校计算机专业课程《CINEMA 4D》教学中的优势,然后以《CINEMA 4D》课程为例,探讨基于翻转课堂的教学模式在教学过程中的具体应用,包括学习任务单的制定、自主学习环境的构建、资源和任务发布、协作学习、成果展示等环节。  关键词:翻转课堂;中职教学;
摘要:信息技術的发展为我国的农业转型带来了机遇和挑战,“互联网 ”为现代农业信息化建设提供了新路径和方法。针对农业信息化中建设项目分散、条块分割、投资主体不明确,发展内生动力不足问题,提出一种基于互联网 020电子商务平台的农业信息化建设框架。该框架以线上线下电子商务平台为核心网络,吸引农业信息化利益相关方逐步扩展农业金融、智能化生产、网络经营、农业管理及第三方服务等应用。  关键词:农业信息化;
摘要:从传统教室到多媒体教室,技术的加入使得广大教育者创造了更多的教学方法,这些创新提高了教学水平。伴随5G时代,高可靠互联网等新技术的加入,为响应国家对于教育教学的宏观规划和逐步实现我校师生日新月异的教学学习需求,为探索适合我校“智慧教室”建设模式,本文以西安工程大学多媒体教室升级改造为契机,通过“智慧化”系列改造和推广活动,使改造后的教室满足了开展混合式教学、翻转课堂、PBL教学的需求,降低了
摘要:本设计由特定摄像头作为颜色识别系统,采用两机械臂的操作方式,以机械爪作为操作设备,对魔方进行还原的操作。机械控制作为解魔方机器人的核心模块之一,是机械结构与算法的桥梁。  关键词:Arduino单片机;魔方算法;机器人  中图分类号:TP302 文献标识码:A 文章编号:1009-3044(2018)17-0267-02  机器人技术的不断发展与进步,可以说是各项科学技术共同发展所得到的一个
摘要:随着教育制度的不断发展与成熟,传统教学模式的弊端日益显现。本文以EEG监测技术为例,针对传统教学中存在的问题,提出人工智能技术在教育教学中的应用与实践研究。通过EEG注意力监测技术在教育教学中的引入、应用及发展,使教学方案得到有效的改进,教学质量得到大幅度提升,为高校的教学改进提供新思路与新方法,解决现阶段存在的问题。  关键词:人工智能; EEG注意力监测;教育教学  中图分类号:G304
摘要:慕课(MOOC),即大规模开放在线课程,是一种新兴的在线课程开发模式。该文在分析Kerberos认证协议的基础上,讨论了传统课堂在对学生讲授Kerberos协议中存在的难点问题,通过将慕课教学模式在Kerberos认证协议教学中进行应用的案例,进一步阐明了如何将慕课教学手段如何在课堂中进行应用的方法,对慕课教学进行了有益的探索。  关键词:慕课;教学模式;教学改革  中图分类号:G642.0
摘要:随着“互联网 ”被明确作为国家产业升级转型战略的关键方向,计算机网络技术因此在计算机相关技术体系中的地位得到进一步加强,作为主要传授计算机网络技术的计算机网络类课程,其教学的效果也因此被赋予了更高的要求。计算机网络类课程的教学内容,主要围绕计算机网络体系的层次結构展开,进而系统地、分层次地讲述计算机网络的基本概念和工作原理。计算机网络类课程的基础知识内容具有概念抽象、体系逻辑强、无其他相关课
摘要:在互联网 教育环境下,大学计算机基础课程必须抛弃传统观念,构建创新理念,充分运用计算机通信技术与网络技术,引入慕课学习模式,结合SPOC与翻转课堂等模式,建立新的教学环境,满足不同层次的学生要求,从教学内容,教学方式,教学行为,教学理念等多个方面进行改革与创新,更好地推动大学计算机基础课程的教学与实践的推广。  关键词:互联网;慕课;SPOC;翻转课堂  中图分类号:TP393 文献标识码:
摘要:针对当前较为常见的Oracle数据库应用,尤其是数据体量越来越大的现状下,文章提出了几种切合实际应用的优化方式,在一定程度上提高了SQL语句的执行效率,极大地加快了数据的查询检索等操作,充分实现了优化的目的。  关键词:oracle;数据库;SQL语句;查询;优化  中图分类号:TP311.13 文献标识码:A 文章编号:1009-3044(2018)08-0012-02  随着大数据、物联