Hadoop火起来

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:chenming000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   12月2日,缤纷的雪花和凛冽的寒风未能阻挡前来参加为期两天的Hadoop中国2011云计算大会的开发者。从2008年在计算所举办的只有几十人参加的首届Hadoop开发者技术沙龙到今天900多人参加的技术盛会,Hadoop在中国的发展速度已经超出了主办者的预期。国内企业和研究机构积极参与和关注,eBay、EMC2、IBM、Intel、微软等国际大厂也蜂拥而至,这成为本次大会的特色之一。
  大数据引爆Hadoop
   2011年10月将成为Hadoop发展史上的一个里程碑。10月上旬,甲骨文在旧金山举办的Oracle Open World技术大会上首次推出基于Hadoop的大数据库机;10月中旬,微软在西雅图举办的SQL PASS 2011数据库大会上宣布将在Hadoop上实现搭建Windows Server以及Windows Azure平台;10月下旬,针对大数据的社交商务成为IBM在拉斯维加斯举办的IOD数据库大会上的热点。至此,三大数据库厂商不约而同地拥抱Hadoop。
   “产业界和学术界都看好Hadoop并不是偶然现象。数据作为一种宝贵的资产越来越受到重视,从海量数据中获取有价值的信息正变得更加困难。据称,到2020年全球数据资产规模将达到35ZB(10的18次方字节)。” 本届大会主席、中科院计算所副总工程师程学旗表示。
   程学旗说:“Hadoop最初是一套实现了Google的Map/Reduce和GFS的开源软件。对于学术研究来说它有两方面价值,一方面Hadoop可以看作是海量数据分析处理研究的平台和工具,利用它可以研究和验证一系列面向海量数据的精准分析,深度挖掘相关的网络化算法;另一方面,Hadoop可以看作是科研工作的放大器。”
   Hadoop之父、Apache软件基金会(ASF)主席Doug Cutting在主题演讲中表示,处理器、存储等硬件的发展,使得人们能够处理和存储更多的数据,分析这些数据将会使大家变得更加智慧。Hadoop已经成为处理大数据的分布式操作系统的内核,同时这一内核也成为业界的事实标准,而Apache为Hadoop提供了生态环境。
   Doug认为,Apache的强壮表现在4个方面:授权的多样性和透明性让用户可以主宰自己的命运;没有人能收买ASF,Apache不会被厂商锁定; 允许竞争性的项目存在;松散联盟式的生态系统促进了平台的演进。
   “Hadoop一旦成为海量数据计算的事实标准,对于信息化应用将是颠覆性的,很多原来由于数据规模而难以解决的问题将迎刃而解。”程学旗强调说。
  商务应用:Hadoop的新天地
   海量数据存储与处理是互联网公司不可回避的问题。因此,Hadoop首先受到Yahoo等公司的青睐。社交网络和Web2.0的兴起使得数据,尤其是非结构化数据呈现指数级增长,云计算和移动互联网的趋势更是加剧了这一增长势头。然而,传统的数据库却难以处理海量的非结构化数据。
   今年7月,赛迪传媒发布了《走向以人为本的信息化》白皮书。白皮书认为,当前基于流程的信息化侧重在处理占企业总数据量不到20%的与流程相关的结构化数据,对占数据总量80%的由人产生的非结构化数据却无能为力。非结构化数据不仅所占比重大而且数据量增速也高于结构化数据。充分发掘和利用非结构化数据背后的商业价值,将成为企业应对剧变的外部环境挑战的有效途径。可以预期,对非结构化数据价值的深度发掘和信息的充分利用将把企业信息化建设带入以人为本的新阶段。
   “海量的非结构化数据的问题一直存在,只是现在更为突出,但在一项行之有效的新技术尚未成熟时,大家都在规避这个问题。”程学旗表示。Hadoop不仅能存储和处理海量数据,而且由于其硬件系统是基于错误常态存在的理念而设计的,这种思路能使用户在构建云计算环境时降低对硬件品质和性能的要求,从而使得Hadoop成为企业实施云应用时的首选。这就为Hadoop从典型的互联网服务领域的应用拓展到了更为广阔的企业商务应用提供了可能,这也是IBM、甲骨文和微软三大数据库方面厂商关注Hadoop的原因所在。
   事实上,基于Hadoop的企业解决方案已经显示出其在性能和架构上的优势。早在2009年,中国移动将其属下某分公司的客户行为特征分析的商业智能应用放在基于Hadoop构建的x86架构云计算平台上进行对比测试,测试结果表明,在正确度符合商业标准的前提下,与该应用运行的基于Unix的平台相比,数据处理性能增加约30倍,数据挖掘性能增加约9倍,应用性能提高3~7倍;成本则只有Unix平台的1/6,同时还减少了机房的占地面积。
  从Hadoop大会看中国社区成长
   “2008年,计算所从举办Hadoop技术沙龙开始,就意识到海量数据的存储、管理、挖掘和服务等问题的科研价值,也意识到海量数据处理的实际需求是来源于生产,来源于企业的。同时,我们还希望维护一个良好的大规模软件系统的开发、利用的生态系统。因此,计算所创办了Hadoop中国社区和Hadoop中国大会,借此搭建Hadoop技术研发和海量数据计算与深度处理的交流平台。” Hadoop中国社区发起人、中科院计算所查礼博士表示。
   在回顾Hadoop中国社区发展时,查礼说:“2008年,Hadoop还不成熟,bug一堆,功能特性也较少,除了国内少数几家大型互联网公司使用Hadoop处理海量数据外,其他开发者和企业还处于尝试阶段。到2009年,从参与Hadoop中国大会的企业来看,数量有所增加,但主要还是互联网企业,可以说国内处于起步阶段。到2010年,有600人参加了Hadoop中国大会,一些非互联网服务企业也开始使用Hadoop技术,Hadoop技术在国内的社区初步形成。”
   查礼表示,今年,EMC、微软等公司宣布支持/兼容Hadoop软件栈的动作以及一些以Hadoop为技术基础的咨询服务公司的出现标志着Hadoop及其海量数据计算技术已经成为业界事实标准。今年参加Hadoop中国大会的人数大大超过往年,各大传统IT厂商也积极参与,从另一个方面说明了海量数据计算技术的前景和价值。
   Hadoop未来在中国能否健康高速成长的关键在于是否有一个健康的生态环境。程学旗表示,计算所举办Hadoop中国大会的初衷之一就在于维护生态环境,这个会不同于一般的学术会议,更难得的价值在于让更多的与海量数据相关的开发、研究等从业人员了解Hadoop技术,了解Hadoop能够做什么,不能做什么。另外,开源软件是取之于大家,回馈于大家的,只有更多的人参与进来才能使Hadoop软件和技术发展得越来越好,计算所在这方面的科研成果也可以通过开源的方式造福社会。有人说,Hadoop是继Linux以来最成功的开源软件,这从一个侧面反映了目前Hadoop的发展是良性的。
其他文献
新商机    所谓底层基础决定上层建筑,移动网络通道的拓宽为产业链下游的软、硬件环节提供了新的商机。其中,在2008~2009年最明显的就是“互联网专用终端”的出现。  早在2007年,英特尔就提出了“移动互联网设备”(MID)的概念;紧接着在2008年初,英特尔公布了移动终端的低耗能处理器Atom,并提出了“人的第二台笔记本上网本”这一概念。2009年,在中国市场上,联想、戴尔等PC巨头或是与移
没人会否认这是一个“融合”主导世界的时代,在IT领域更是如此,明确的需求驱动与新兴技术支撑加速了这一进程。  然而,当越来越多的企业用户尝试实现以服务为中心的基础设施架构融合,以整体观来解决IT泛滥难题、强化应变能力时,他们也遭遇了一些前所未有的挑战。在全面转型或逐步改良实现融合的过程中,怎样才能快速高效地实现目标?在设施融合之后,应用之间关联性增强了。如何保证与企业业务密切相关的应用处于合理管理
电子商务行业正在面临拐点。  中企动力携其酝酿四年的电商产品Zshop高调入市,欲掀起电子商务变革的浪潮。  其“1+N”模式兼具电子商务平台和自主电子商务网站的优势。  这也是专注中小企业信息化12年的中企动力提出“新中企时代”战略后的第一个大动作。    淘宝网稳坐B2C、C2C电子商务平台的头把交椅,当当网、亚马逊、京东商城、凡客等B2C电子商务网站格局已经比较稳定,腾讯QQ商城、百度电子商
2011年8月24日,苹果CEO乔布斯正式向苹果董事会提交辞职申请。在乔布斯辞职之前就有传闻说他的胰腺癌再次发作,身体情况堪忧。2011年10月5日,苹果发布了新款智能手机iPhone 4S——虽然被很多认为是换汤不换药的产品,但它还是获得了大量的订单。  2011年10月6日,苹果董事会宣布前CEO乔布斯于当地时间10月5日逝世,终年56岁。想象力再丰富的果粉也不会想到,在iPhone 4S发布
目前,全球经济形势持续恶化,而网络安全形势也愈发严峻。在全球金融和信息安全双重危机笼罩人们日常工作和生活的背景下,信息安全厂商除了要恪守行业职责,为用户提供优秀的技术产品以及专业的服务之外,还需要承担更多的社会责任。    4D防御体系    不久前,卡巴斯基公司正式推出全功能安全软件的三年版产品,在维持价格不变的情况下,延长了服务时间,同时增强了产品性能。卡巴斯基亚太区董事总经理张立申表示,金融
作为中国极早的计算中心之一,北京市计算中心成立于1973年,它也是中国极早、极具影响力的从事计算机应用技术研究及推广的机构,服务对象遍布工业、商业、交通、能源、环保金融、税务、社会事务等多个领域。北京市计算中心自成立以来,完成了上百项国家和北京有关部门委托的研究项目和面向多种用户的服务型项目,为中国计算机的普及、应用和发展做出了杰出贡献。  目前北京市计算中心已经建成百万亿次的超级云计算服务平台。
迈克菲(McAfee)经过十年对中国市场的摸索,终于决定在今年在华设立全新的独资子公司。迈克菲公司首席执行官兼总裁Dave DeWalt接受记者采访时说,这是作为迈克菲在中国市场最新投资项目的一部分,独资公司的成立将标志迈克菲可以像中国本土公司一样在中国市场运作。当然我们也看到了华为和赛门铁克合资公司取得的成绩,我们已经开始寻找这样的机会。    中国市场的潜力    虽然迈克菲并未披露投资新公司
展望谷歌这头IT大象与火狐未来的关系,可以用一句古谚总结:“以势交之,势尽则疏;以利合之,利尽则散。”  —— 本报记者 姜洪军    “大象坐在哪儿?”  这是一个类似脑筋急转弯的冷幽默,答案是:“它想坐哪儿就坐哪儿,因为它是大象。”  2011年7月,IT界的大象——谷歌,开始取消了谷歌工具栏对当前和未来版本火狐浏览器的支持。谷歌与Mozilla基金会的火狐曾是共生关系。2003年,Mozi
“刘总,明年我一定还要来,而且我一定要站到(领奖台)上面去。”11月9日晚,在荷兰阿姆斯特丹由基础设施IT解决方案供应商Bentley举办的盛大的Be 创新奖颁奖晚宴上,中国水电顾问集团华东勘测设计研究院副总工程师王金锋信心满满地对Bentley大中国区总裁刘德盛说。  错失的荣誉  从2004年开始举办的Be创新奖活动是Bentley为基础设施业界具有创新思想的精英举办的联谊活动,同时表彰获奖者
“客户需要的已经不是单一的产品,而是很多产品整合起来形成的一种能力。”IBM大中华区副总裁兼大中华区软件集团总经理胡世忠开门见山地解释了IBM软件集团从向客户提供产品到提供能力的转变。  在IBM看来,如今客户关注的是六大能力:洞察力,将信息转化为洞察;敏捷力,驱动业务整合及优化;协作力,联系和协作;创新力,推动产品和服务创新;优化力,优化业务架构及服务的影响;安全力,管理风险、安全及合规。通过将