华为“4V”金字塔打通大数据价值通道

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:wenyuanyuan0929
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  IDC预测,全球的数据总量将在2020年达到40ZB。40ZB的数据量到底是多少呢?IDC给出了一个比喻:40ZB数据量相当于全球所有沙滩的沙粒总数的57倍。但在如此浩如烟海的数据中,只有不到1%的数据得到了有效分析。数据就像是一座沉睡的宝藏,它需要我们利用大数据这一新架构、新工具,点石成金,变废为宝。
  大数据由业务驱动
  为什么在官方的健康组织还没有发布健康趋势之前,Google就能利用它的搜索引擎准确地预测流行病的爆发?大数据给我们所有人上了一课,也让我们更加坚信,数据本身是有价值的,关键看你如何处理、分析和使用它。
  云计算不是一种新的技术,而是一种新的IT消费模式。同样,大数据也不是简单的技术组合,而是对企业商业模式的颠覆和再造,对业务创新和发展起到强大的推动作用,这样的例子已经比比皆是。
  比如,为了应对激烈的市场竞争,中信银行信用卡中心迫切需要建立一个以数据仓库为核心的分析平台,实现业务数据集中和整合,以支持多样化和复杂化的数据分析。在部署了大数据应用系统之后,中信银行信用卡中心实现了近似实时的商业智能(BI)和秒级营销,运营效率得到全面提升。
  再比如,广东地税依托大数据平台推出的网络发票能够实时采集纳税人的开票数据,实时监控纳税人的开票情况,实时向社会公开开票查询信息,实时为公众查验发票真伪,实现了对纳税人经营行为的全监控。同时,广东地税依托大数据平台还实现了对地税干部的税收执法和行政管理进行全程分析监控,有效防控了各类执法和廉政风险。
  在互联网、金融、电信、能源、医疗、视频监控、政府等众多行业,大数据正在日益显现出其独特的价值。在企业内部,大数据可以为企业提供更科学的决策依据;在企业外部,大数据还是收集客户信息,建立360°客户视图,让企业实现精准化营销的工具。从表面看,大数据带来的是一种技术上的变革,它有效地提高了企业和社会的生产力,而在这种技术变革的背后是业务需求使然,是人们对提高效率的不断追求在推动这种变革的发生。
  纵向打穿“4V”
  经济全球化的趋势促进了大数据的应用需求。企业的管理者需要借助丰富的数据和实时分析工具,提高企业内部的工作效率,同时还要密切与客户的关系,进一步提高客户满意度。商业模式的转变、营销手段的丰富,要求企业不能在旧有的基础架构平台上缝缝补补,大数据需要一个全新的高效的基础架构平台。
  大数据这个概念出现前,“海量数据”这样的称呼人们已经使用了很多年。虽然大数据与海量数据之间还是有量上的差距,但是对于很多企业用户来说,没有适合的工具对海量数据进行挖掘是数据价值难以释放的一个主要原因。在大数据分析工具出现前,商业智能、数据挖掘已经进行了多年,为什么数据的价值没有得到企业充分的重视呢?因为以前的数据挖掘是对抽样数据进行分析,而且数据分析是离线的,数据的价值没能得到全面、实时的展现。
  那么构建一个可用的大数据系统,应该从何处入手呢?
  现在,人们已经基本认同了大数据“4V”的特征:第一,Volume表明数据的体量巨大,企业处理的信息总量已经从TB级别跃升到PB级别;第二,Variety表明数据类型繁多,包括结构化、非结构化等类型的数据,尤其是非结构化数据的大幅增长对传统的处理结构化数据为主的架构带来了巨大冲击;第三,Velocity表明实时处理是大数据的一个典型特征,而这也正是它区别于传统数据挖掘技术的关键所在;第四,Value表明数据是有价值的,这也是大数据挖掘的最终目标。
  “4V”虽然准确地描述出了大数据的基本特点,但是“4V”只是单摆浮搁,并没有从逻辑的角度将大数据应用的递进关系明确地展示出来。正是基于此,华为抛出了金字塔型“4V”理论,展现了从Volume到Velocity再到Variety,最终到Value的层次化的递进式的创造大数据价值的方法论。
  具体来说,第一步,企业需要建立一个能够高效处理海量数据的存储架构平台,它既能处理大量的小文件,也能处理单体较大的文件。第二步,这个存储架构平台要具备极高的处理性能,因为大数据对实时处理的要求非常高。第三步,这个存储架构平台要能处理多样化的数据,包括结构化数据和非结构化数据。只有通过前面三步打下的基础,企业用户才能进入最后一步,在一个高效的专门为大数据构建和优化的平台上进行数据分析和挖掘,并最终获得所需的价值。
  大数据价值的实现过程是一个递进的逐层深入的过程,但是建立高效的存储架构平台是前提,它是大数据落地的基础。
  Hadoop不是全部
  现在人们一谈到大数据,首先会想到Hadoop。其实,Hadoop只是大数据基础架构与上层应用分析之间的一个桥梁,而不是大数据的全部。在广电等很多领域,大数据处理并不一定要用到Hadoop。现在,使用Hadoop更多的是一些互联网企业。然而除了互联网大数据以外,行业大数据同样重要,甚至价值密度更高。因此,将Hadoop与大数据划等号,这是一个认识上的误区。业内一位大数据专家指出,大数据不是一个分析工具,而是新的基础架构。
  华为认为,大数据分析的一个重要前提是,必须先建立一个高效的大数据存储平台。那么,所谓的高效又是如何来衡量的呢?
  高效的第一个衡量指标是就是性能。性能是大数据存储平台的基石之一,没有性能的保证,大数据系统无异于空中楼阁。比如,中央电视台每晚7:30要准时播出天气预报,如果气象分析要经过24小时才能得到最后的结果,就会错过天气预报播出的时间,即使得到的预测结果再准确也是无用的结果。另外,在智能交通领域,交通部门需要掌握实时的路况信息,对交通违章或其他突发事件进行及时处理。如果后台的大数据采集、处理和分析平台不能在最短的时间内给出结果,那么智能交通也只能是一句空谈。其实不仅是在大数据方面,在整个IT领域,企业用户对性能的追求都是无止境的,只不过大数据对实时处理的要求非常高,所以高性能对于大数据来说显得尤为重要。
  其次,大数据强调的是简化使用,提高效率。如果不具备专业技能和人员,Hadoop的实施将非常困难。简化大数据的使用,其核心是在同一个平台之上针对数据的全生命周期进行管理,尽量避免异构环境下的数据迁移、数据丢失带来的风险等。
  最后,高效的大数据存储平台应该采用多位一体的技术架构,即在同一个系统内,实现存储、归档和分析的所有功能,完成对数据的管理,并提供开放的分析接口,与BI软件和应用软件更好地连接,进一步提高查询效率。此外,在这样一个一体化的结构之上,用户还可以根据业务的情况灵活添加相关的功能模块。华为的大数据存储平台就具备了上述功能。
  大数据带来的改变从基础架构层面一直延伸至业务层面。企业的管理者应该意识到,业务的创新需要底层创新的架构来支撑。从业务的角度看,企业的核心诉求是简化应用,实现可持续发展,提高业务的效率,而这些业务目标的实现必须建立在一个合理的、高效的架构之上,只有这样才能更好地发挥IT的作用,获得更大的数据价值。
其他文献
联盛集团是在江西地区颇有影响力的零售商超企业。今年,联盛集团成立电子商务公司并且动作频频。在电商巨头林立的市场上,一个区域型零售企业如何实现从线下到线上的电商转型?在联盛的电子商务战略中,亮点颇多。  在江西九江,恐怕没有人不知道“联盛”这个名字。联盛集团以商业起家,从百货购物广场、区域购物中心到连锁超市,网点遍布九江市区、瑞昌市和周边各县市。就是这样一家在当地颇具规模和影响力的区域型商业企业,面
10月29日,由工业和信息化部中国电子信息产业发展研究院(赛迪集团)主办,《中国经济和信息化》杂志社承办的“中国信息化推进论坛”在京举行。论坛以“中国信息化推进的三季度形势分析与四季度走势判断”为主题,对我国信息化领域的发展情况进行研讨。会上发布了《赛迪预测——2013年第三季度工业和信息化形势分析与走势判断》的系列报告。  中国电子信息产业发展研究院(赛迪集团)党委书记宋显珠出席了此次会议并致开
北京爱德威通亮技术有限公司是中国国内最早从事智能交通领域业务的公司。公司本着专业化、科学化、以客户为中心、以市场需求为导向的经营理念,专门从事城市智能交通管理系统类产品的研发、加工、集成与工程服务,并将解决日益严峻的城市交通问题作为公司的核心发展目标。  北京爱德威通亮技术有限公司(简称爱德威)是中国国内最早从事智能交通领域业务的公司。公司本着专业化、科学化、以客户为中心、以市场需求为导向的经营理
在日常办公中,用户经常会有需要打印照片级文档的时候,如果为了打印几张文档就派人到影印店输出,不仅花费时间较长而且成本很高。有了佳能PIXMA iP7280,用户在办公室就可以解决这个问题,提高了用户的工作效率。  颜料、染料墨水共同配合  为了达到更好的输出效果,iP7280配备了五色独立式墨水系统,其中颜料黑色墨水和染料黑色墨水共同组成了独立式双黑墨水系统。在打印过程中,iP7280会使用颜料黑
当前,云计算、ICT融合趋势明显,诸多通信厂商陆续在这些领域发力,力争成为行业领先者。以数据通信设备起家的上海斐讯数据通信技术有限公司(以下简称斐讯)也不再仅仅聚焦于网络通信设备及解决方案,而是整合MOBILE(个人移动终端)、SOHO(家庭宽带终端)、ENT(企业网络终端)、ICT(信息通信技术服务)、CLOUD(云计算业务)五大业务单元,并在个人移动终端、家庭终端和云计算三大业务单元积极发布新
“当你进攻市场的时候,你不应该杀死竞争对手,你应该让对手受伤后仍能行走。尸体看上去很糟糕,而且吸引注意力。”一位工业界大佬曾这样对盖茨说。他说这番话时正值微软对网景展开全面剿杀,而最终惹上反垄断官司之际。  刀战的序幕  “盖茨和鲍尔默像两个大孩子,他们不知道他们已经多大了,他们总是在抢劫东西。”被称为“以太网之父”的鲍勃·梅特卡夫曾这样说。  1992年秋天,微软的对手们纷纷指责微软利用了在操作
“我们对BYOD可以说是又爱又恨。BYOD让我们可以随时随地办公,提高了工作效率。但是另一方面,BYOD又让我们的生活和工作绑得更紧了。因为有了各类移动终端,我们变成了全天候工作。”一个用户在戴尔举办的终端用户计算研讨会上这样说。其实,不管你是主动拥抱还是被动接受,BYOD都已经是一股不可逆转的潮流。  找到契合点  在戴尔终端用户计算研讨会上,记者听了来自金融、政府、教育、制造等行业的客户介绍以
Gartner在一份调查报告中将Nimble公司列为美国硅谷成长速度最快的存储公司。Nimble赖以成名的“武器”就是融合了SSD与SATA磁盘的混合型存储。在专业咨询顾问公司Wax Myrtle的撮合下,3月27日,Nimble与东华软件股份公司(以下简称东华软件)签约,东华软件成为Nimble在中国的独家代理商。  Nimble混合型存储从两个层面诠释了存储融合之道:第一,SSD与SATA磁盘
北京飞讯数码科技有限公司是一家以多媒体技术研发为核心,具有自主知识产权的高新技术企业。公司是国内专业的多媒体指挥调度与视频监控整体解决方案提供商。  北京飞讯数码科技有限公司成立于2004年,是一家以多媒体技术研发为核心,具有自主知识产权的高新技术企业。公司总部位于亦庄北京经济技术开发区,拥有1600平方米的办公场地,在西安、福建、云南设立了分支机构,并在武汉建立了研发基地,是国内专业的多媒体指挥
以前进入数据中心机房,人们的第一感觉就是冷。为了保证机房内IT设备的正常运行,机房温度通常要控制在20℃~25℃,这就需要专门的制冷设备,会消耗更多电能。能耗是困扰数据中心用户的一个大问题,有时甚至会影响机房的扩展和IT设备的部署。为了实现节能减排,在国外,高温数据中心正日益流行,即使在35℃~40℃的高温环境中,也能保证IT设备正常运行。  北京天地超云科技有限公司(以下简称天地超云)注意到了这