数据仓库与Hadoop需分工合作

来源 :计算机世界 | 被引量 : 0次 | 上传用户:tonfy1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  大数据热引发了人们对Hadoop的极大兴趣,同时也引来一些误解,认为既然Hadoop能帮助解决数据的处理和分析问题,它就可以替代传统的数据仓库。
  “数据仓库(数据库)与Hadoop(MapReduce)其实是两类有着很大区别的技术,这两者之间不是竞争关系,而是合作的关系。大数据或者说Hadoop的上升不会带来数据仓库或数据库市场的下降。”在日前举行的Sybase IQ15.4发布会上,Sybase中国公司技术总监卢东明对此予以了澄清。Sybase IQ15.4是Sybase公司的一款数据仓库产品,也是业界为数不多的真正采用列式存储技术的数据仓库,正是由于采用了独特的列式存储使得其具有高压缩率和高速处理能力。
  卢东明告诉本报记者,Hadoop或者MapReduce最初是为解决信息搜索问题而诞生的,然而,搜索问题和数据仓库或数据库问题是两个完全不同的问题,其解决思路存在非常大的不同。比如,数据库和数据仓库讲究数据的一致性,同样的查询其结果一定唯一,而Hadoop可以允许不同结果存在;Hadoop的分布式处理架构支持大规模的集群,所以可以轻松应对PB级数据,而数据仓库和数据库则要受到很多技术限制。另外,在处理数据的规模上也存在量级的差距。
   “数据仓库(或数据库)与Hadoop有着完全不同的应用场景,分别适应于不同的数据规模。它们之间不能相互取代,而是必须相互合作。”卢东明说。
  事实上,随着大数据时代的到来,越来越多的传统数据仓库选择了与Hadoop进行合作来满足用户的数据分析需求。一种典型的合作方式是先通过Hadoop把大数据进行预处理,然后通过传统数据仓库引擎提供的工具把这些预处理后的数据导入到数据仓库中,利用传统数据仓库中的数据分析和挖掘引擎来对数据的分析。Sybase IQ 15.4就支持这种方式,为此,Sybase IQ 15.4推出了很多接口。比如,通过数据库的外联接口可以同时访问这两个数据集里的数据,其中一个来自IQ,另一个来自Hadoop;Sybase IQ 15.4还提供了针对Hadoop的访问接口,所以可以用一个标准的SQL通过IQ去访问Hadoop的数据。
  
其他文献
“随着国外企业在信息安全、成本控制等方面的竞争优势突显,国内制造业企业提升IT运维自动化水平正变得更加紧迫。”卡西亚销售经理尹浩在接受本报专访时表示,在中国,石油、冶金等资金比较充裕的制造业企业已经开始起步IT运维自动化管理。  我国早期的制造业企业曾花费大量资金购买营销系统、生产系统、ERP系统、CRM系统等软件,然而由于没有一套行之有效的IT运维自动化管理,造成上百套系统之间没有任何关联,企业
本报综合消息 近日,戴尔正式宣布推出基于ARM架构的全新服务器产品。该服务器代号为“Copper”,隶属于“Dell Seed Program”计划的一部分。  戴尔也是继惠普之后,又一家宣布推出ARM架构服务器的重量级生产商。多年以来,英特尔主导的x86架构处理器一直是服务器厂商的首选。  戴尔官方发言人表示,为了响应客户对数据中心密度与省电效益的需求,该公司内部从2010年就开始测试ARM服务
截至目前, iPad的全球销量已超过了1400万部,与其他平板电脑相比,iPad显然有着巨大的领先优势。不过iPad也遭到了来自各方面的挑战,例如尺寸更小的屏幕、功能更强的多媒体技术或数量更多的端口。2011年世界移动通信大会(MWC)成了LG、三星、宏达电、东芝、宏和优派等重量级厂商展示各自平板电脑的舞台。本期我们特别选出了在这次大会上首次发布的10款可与iPad媲美的平板电脑,使读者先睹为快。
近日,移动互联网公司DeNA和阿里巴巴云计算公司(以下简称“阿里云”)宣布,双方将在云计算和移动互联领域展开深入合作,为广大开发者提供从底层资源、开发到运营的全方位支持,此举意味着,阿里云正在发力建设的云计算生态链正在初步发挥效应。  据了解,阿里云OS将深度集成DeNA的游戏产品,用户可以使用阿里云账号直接登录游戏,并使用阿里云OS的支付底层。基于阿里云OS云市场平台,DeNA还在此之上发布了官
“IT产业的发展总是伴随技术与标准的不断完善,特别是中间件作为重要的基础软件,既要向上支撑各类业务系统运行,又要向下对接操作系统、数据库等底层资源,与中间件相关的标准和规范就显得非常重要。”东方通技术部门相关负责人表示。作为中间件厂商,东方通一直很重视中间件相关技术的标准化工作,并参与制定了Java EE7、SOA等国际标准。  2011年,Java技术标准组织JCP批准了Java EE7(JSR
本报综合报道 近日,工业和信息化部部长苗圩表示,中国将继续推进TD-LTE规模技术试验,合理规划频谱资源,促进TD-LTE产业成熟,同时鼓励中国通信制造企业积极参与包括LTE FDD商用在内的国际竞争。  TD-LTE是我国自主知识产权的4G标准,继TD-SCDMA成为被全球认可的3G国际标准后,TD-LTE-Advanced也被国际电联确立为国际4G标准之一。苗圩指出,“由于中国TD-SCDMA
新一代信息技术云计算正在改变着企业的运营和商业模式,与此同时,安全问题也接踵而来。  “在云环境下,虚拟化是基础,虚拟化技术是通过对硬件资源进行整合和按需分配,以资源池的形式响应内部IT系统的资源需求。由于虚拟化架构的网络环境是随时可变的,这就对防火墙、IDS等传统信息安全产品带来了新的挑战。”椒图科技常务副总经理李科表示,“在云架构中,操作系统镜像(Guest OS)作为连接底层资源池和上层应用
“钱紧”是很多处于创业期或者高速成长期的软件企业负责人的共同感受。创业初期,企业研发投入、市场开发投入巨大,资金需求旺盛。然而,软件企业普遍具有轻资产(缺乏抵押物)、缺乏有效担保、高风险的发展特点,直接从银行获得贷款资金的难度较大。“空有好的技术、好的创意,却没有资金将这些技术和创意落地,就好比我们在推着一辆没有油的宝马,缺的就是加油的钱。”一位创业者这样感叹。  事实上,如何破解软件企业的资金难
本报综合消息 3月21日,惠普公司正式宣布将旗下成像和打印集团并入个人系统集团,也就是打印机业务并入PC业务部门,新部门将由PC业务主管托德·布拉德利领导,原打印与成像部门总裁维奥梅什·乔希将退休。重组后,惠普将形成个人系统集团,惠普服务集团,企业、服务器、存储和网络集团三大业务部门。  这也是惠普女掌门惠特曼出任CEO并宣布保留PC业务之后,做出的第二项重大决策。她表示,新的组织架构将“加速决策
加拿大旅行社Accovia,通过WebSphere,以前要几天才能给客户提供的日程和报价,现在只需几个小时就能通过动态的系统快速提供给客户,让服务更差异化;物流公司ODYSSEY面临着不断拓展全球业务的挑战,既要实时将交易全面记录,还要了解到更好的准确性,特别是在交付包裹的时候,在处理方面要有更准确的东西。  自从1998年IBM推出WebSphere Application Server之后,便