数据库部署因云而变

来源 :计算机世界 | 被引量 : 0次 | 上传用户:hujun5100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据库是各种IT系统中最常见的组成部分,从上世纪80年代初以来,在企业的各种基于数据库的应用系统中,关系型数据几乎一统天下,而进入云计算时代,由于互联网应用的兴起,关系型数据库受到了以大数据处理为主要卖点的NoSQL数据库的强力挑战。为满足云计算时代对数据处理的要求,特别是对高扩展、读写速度、支撑容量以及建设和运营成本方面的要求,关系型数据库自身不断做出调整,向分布式数据库演进。
  处理非结构化数据
  在数据库应用中,经常会涉及全文文本、图像、声音、影视、超媒体等信息类型,这些信息的字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成,这就形成了典型的非结构化数据。在企业中非结构化数据主要有办公文档、披露的信息、Web发布的页面,以及工作中一些培训、宣传、监控用到的多媒体信息等。
  如今,非结构化数据处理越来越普遍,而非结构化数据的处理也成为关系型数据库面临的一个很大挑战。一般而言,非结构化数据的组织主观性比较大,缺乏统一的规则,处理起来难度大,然而,非结构化数据越来越普遍,促使各关系型数据库厂商不得不对其产品进行拓展而使其具备管理非结构化数据的功能。
  目前,主流的关系型数据库,包括Oracle、SQL Server、Sybase、DB2都或多或少对非结构化数据类型提供了支持,如SQL Server 2008中引入了文件流fileStream技术,支持非结构化文档的存储、查询和检索。Oracle数据库则采用大对象BLOB技术存储非结构化数据。面向对象的数据库中还有一个典型代表是Cache数据库,在非结构数据的支持上走得更远些。
  云计算与分布式数据库
  数据海量、类型复杂、响应速度要求高,这些都对现有数据库构成挑战。实际上,无论是内存数据库还是基于存储的数据库,当前的这些主流数据库都很难支持面向特大型非结构化数据的应用系统,而随着分布式计算、云计算技术的发展,数据库找到了一种应对办法,这就是数据库的分布式实现。
  分布式数据库是从数据库与服务器组合关系来说的,它由若干个站集合而成,这些站又称为节点。分布式数据库系统通常使用较小的计算机系统,由多个计算机组成,每台计算机中都有数据的一份完整拷贝或一个分片,计算机通过网络互相连接,共同组成一个完整的、全局的大型数据库。Oracle的并行数据库RAC就是一种分布式数据库,它的核心技术正是分布式计算。RAC共享了多种资源,采用统一的数据库命名空间和一套共享的存储。同样,GreenPlum也是一种分布式数据库,它实现了简单的共享,共享的内容是管理节点和数据库命名空间。
  严格说来,分布式数据库并非因云计算环境而生,但却很适合云计算环境下的需求。这是因为云环境下要求数据库具备很强的横向扩充能力,这就要求节点之间尽量减少共享,而采用节点的分片技术来并行处理是解决办法之一。
  云计算技术的一个重要内容是任务的分解和结果的汇总,然后通过后台的并行计算来完成大规模的处理。对于具体行业来说,云计算平台软件、虚拟化软件都不需要自己开发, 但面向特定行业的大规模数据处理应用软件没有通用的产品,需要针对特定的应用需求专门开发,其中会涉及诸如并行算法、索引查询优化技术研究以及系统的设计实现等。例如,提出云计算的Google公司为实现其搜索服务,专门设计了新文件系统(GFS)和存储库(Bigtable),采用调度器(Scheduler)的主从调度技术将存储信息和任务分片(Sharing),并采用映射归约(MapReduce)处理技术,从而实现了对网页的存储检索,最后将一个大型的数据库分成多片,调度器(Scheduler)负责任务分解,将结果分拆给节点。每个节点负责一个数据片,负责完成数据库的基本功能(插入、复制、查询),并把结果传给上层的调度器,从而使数据处理达到横向扩展(Scale Out)的能力。
  在 RAC中,命名空间是一个逻辑概念,不会导致资源瓶颈。RAC数据库本身是一套基于磁盘的数据库,其服务器节点的磁盘操作、没在内存缓冲区的磁盘读写操作都需要共享的磁盘来完成,因而统一共享的存储是RAC的资源瓶颈之一,而RAC的性能瓶颈还会体现为后台磁盘的I/O瓶颈。Oracle推出的一体机Exadata,其中一个重要的特点是采用并行计算的存储服务器和闪存,以提高存储的I/O能力。在其满配的一体机中,数据库服务器有8台,存储服务器为14台,可见一体机设计中对存储I/O的偏重。
  在GreenPlum体系中,在主机上规划查询项目,并将其分成若干部分在节点上并行执行,所有通信功能都在一个高宽带网络互连体系上实现。这种体系下每个节点都有一个通往本地磁盘的独立高速通道,因为没有共享存储,存储和节点都有很强的横向扩展性能力。
  云环境下的数据库架构设计
  基于云计算对灵活性和可扩展性方面的要求,云计算下的数据库可以使用多个分片数据库并行处理,来形成一个超级大数据库,这个数据库共享的组件尽量少,因而不太适合共享存储。而随着虚拟化技术的提高,特别是虚拟机的性能损耗符合一定要求时,分片数据库也可以架设在虚拟机上。借组云计算的资源调度技术,这样一个可伸缩的并行数据库可以在云计算环境中形成(参见附图)。
  值得一提的是,云计算的发展使得数据库的扩展更为简单可行。其中,云管理平台负责资源的监控、自动调度,当查询类并行数据库的性能不足的时候,云管理平台可以自动为虚拟机(VM)增加资源,或通过增加新的虚拟机(VM) 来增加并行数据库的处理能力;而当系统面临的压力减少时可以通过减少分片处理数据库来减少资源需求,或通过减少所在虚拟机(VM)的资源。当然,这就要求查询类并行数据库的管理主机能感知资源和分片数据库的变化,而重新分配处理任务。
  目前,云计算还处于发展过程之中,但一些云应用已经具备大规模处理能力,针对简单、同质、重复使用的应用(如一种数据处理、一个查询,邮件收发等标准化的功能),已经可以将大量的PC服务器组合,形成一个超级的计算资源来完成指定的任务,如在搜索、地震处理、气象分析、核爆模拟方面展现巨大的能力,通过相关软件可以将多服务器整合,形成超级处理资源,其应用软件设计并行处理能力可以将一个巨大但相似的计算任务分解到不同的处理节点,在管理节点的统一调度下,每个节点获得一部分数据,先独立处理,然后与管理节点协商,并与其他的节点相互通信,交换少量数据,最终将一个巨大的计算任务完成。
  不过,总体上,数据库在可扩展性这一方面的能力还不是很强,目前,GreenPlum和VoltDB等分布式数据库正在朝这一方向努力,并且已经具备了一定的并行能力。相信只要有市场需求,分布式数据库一定会继续进步,不过,是否会出现一种真正的云数据库还值得观察。
其他文献
本报综合消息 1月17日下午,日本社交游戏平台运营商DeNA宣布与网龙公司共同组建合资企业,面向中国市场开发和运营手机社交游戏。新公司预计将于今年一季度正式成立,注册资本600万美元。  根据DeNA方面介绍,合资公司初期员工约30人,将在中国进行非中文社交游戏的本地化工作,包括DeNA自主研发和第三方授权的游戏。新公司运营的本地化游戏将在DeNA的Mobage梦宝谷及网龙应用分发平台上发布。  
毫无疑问,我们已经步入了云时代。放眼神州大地,一座座数据中心如雨后春笋般拔地而起,服务器数量与网络基础架构的规模屡创新高;互联网建设也在高速发展,骨干与接入带宽的不断提升,为用户业务带来了日新月异的应用体验;而3G与无线技术的普及,又让移动终端成为后PC时代真正的宠儿,正在掀开移动互联的新篇章。  从底层网络的角度看,通信技术的发展构建了多个维度的高速通路,让一切变为现实。同样,用户也必须借助不断
在当今这个产品更新频繁、技术日新月异的时代,要从众多产品和解决方案中找到适合自己需求的并非易事。为此,我们历经数个月的产品征集和梳理,精心评选出了如下代表当今技术和产品发展主流趋势的产品和解决方案,并授予它们“计算机世界2013年度产品奖”,希望能为企业在产品和方案选型中提供一些参考。  2013年度优秀产品奖  华为 OceanStor9000大数据存储系统  捷视飞通(iFreecomm)MT
凡客将办公地点搬离繁华的双井,入驻北京郊区亦庄是一个标志性转折,资金链紧张的猜测更是一时间漫天飞舞。为什么一个曾经红极一时的互联网快时尚代表走到了今天这个地步?  业界给出的结论:成也品牌,败也品牌。  6年来,凡客紧紧围绕如何把“凡客”塑造成为中国第一大互联网服装品牌而进行。名人光环效应,以及出色的广告创意,凡客体走红,从百度指数上来看,凡客品牌效果深得网民认可。但是陈年忽略了一点,产品质量同样
本报综合报道 4月12日,工业和信息化部宣布,《信息安全技术公共及商用服务信息系统个人信息保护指南》已编制完成,现已作为指导性技术文件通过全国信息安全标准化技术委员会主任办公会审议,正按照国家标准审批程序上报国家标准化管理委员会批准。  这项标准明确要求,处理个人信息应当具有特定、明确和合理的目的,应当在个人信息主体知情的情况下获得个人信息主体的同意,应当在达成个人信息使用目的之后删除个人信息。 
21世纪头10年,我们感到金融、石油危机带来的紧迫感,也感到了云计算、基因技术等产业革命带来的兴奋感。进入新的10年后,这两种感觉交织在一起,带来了更多变革的味道。  从2010年起,英特尔在不同场合更多地提及对于今后10年社会变化的展望。不管是来自海外还是中国本土的英特尔高管们,众口一词地说当前社会进入了一个全新的个性化互联网时代,各种层出不穷的智能互联设备,将带来激动人心的增长机遇。  在机遇
一个移动公司的客服经理、一个镇中学的美术老师和一个影楼老板,让江苏省徐州市沙集镇改变了它的命运;  一个外地经商返乡的文化人,让浙江省义乌市的青岩刘村从地图上一个名不见经传的红点变成了大名鼎鼎的“中国淘宝第一村”;  一个农村经济委员会信息中心主任,用了7年时间建热线、搭平台,用最“笨”的方法,把农村的“笨鸡笨鸭”卖到了城市。  在全国各地,每天都演绎着通过互联网的“农村致富故事”。  在农村的广
近年来,中国石油结合自身发展战略和业务需求,加快了信息化建设进程,将信息化作为提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。  在实际工作中,通过对信息运维管理的分析研究,并结合销售信息运维工作实际情况,中国石油四川销售公司逐步摸索出适应成品油销售企业需要的信息运维管理模式。  成品油销售企业信息运维管理的现状  随着企业信息化建设不断推进,各管理环节对信息系
每年的“国际消费者权益日”都非常热闹,就像电影《让子弹飞》一样,充满着亢奋、狂暴和无厘头的明争暗斗:有人觉得自己的价值观不被理解,有人觉得应该顺势而为,有人想打、有人挨打,还有人藏起来了。  在中央电视台披露的“3·15消费投诉榜”中,网络购物一直是投诉的重灾区。仅仅央视这个平台,在去年“3·15”晚会前夕的征集活动中,网络购物就是当时的投诉焦点,《焦点访谈》、《新闻直播间》等栏目也先后曝光过电子
s在爱迪生于1879年发明白炽灯的121年后,美国和欧盟开始在国家层面推进“国家半导体照明计划”,要求在2012年前用LED(半导体发光二极管)灯全面取代白炽灯。我国也于2003年提出发展半导体照明计划,要求2016年全面淘汰白炽灯。  LED灯采用直流驱动,单灯功率在0.03瓦~0.06瓦之间,电光转换效率接近100%,相比传统光源节能80%以上。且LED灯体内没有松动的部分,没有白炽灯灯丝发光