微软:大数据最重要的是洞察力

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:X446873887
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  从处理到分析 :雅虎TAO之大数据进化
  雅虎公司总部位于加利福尼亚,其搜索引擎、门户网站、新闻推送等网站每月独立访问者超过700万人。 为帮助广告客户更好地分析消费者相关的数据并成功地吸引客户,雅虎构建了定位、分析和优化(简称TAO)解决方案。作为一个功能强大、可扩展的广告分析工具,TAO基于雅虎网站,通过Right Media Exchange为成千上万在雅虎网站上投放广告的客户提供报表。
  TAO平台的一个组成部分是开源软件框架Apache Hadoop,Hadoop曾是公司广告分析中大数据管理的主要工具。每天Hadoop处理超过3.5亿次的广告显示,以每小时进行刷新。TAO的源集群每个季度处理着4640亿行的数据。 尽管如此,该公司依然需要寻求新的、性能更高的、能够与Hadoop协同工作的商业智能解决方案,从大数据当中提取更多更有意义的分析信息,快速地对客户需求做出响应。
  后来,雅虎利用微软SQL Server 2008 R2企业版数据管理软件,创建了一个新的BI解决方案。雅虎增强了其TAO基础架构,现在能够从一个Hadoop集群当中抽取数据并加载到一个第三方的数据库当中,并最终把数据加载到一个SQL Server 2008 R2分析服务的多维数据集当中。多维数据集支持来自客户端,如Tableau Desktop业务分析软件、内部自定义的应用程序等工具的连接。员工可以使用这一软件来创建交互式的数据仪表板并实现热点分析。微软已经开发出了针对Apache Hadoop的SQL Server连接器,实现在Hadoop和SQL Server 2008 R2之间的高效数据传输。目前,对于雅虎TAO用户而言,从Tableau Desktop客户端提交的查询结果返回的平均时间为6秒,而从公司定制的优化的应用程序提交的查询结果返回的平均时间为2秒。
  “在电子商务顾客网上行为分析、智能交通摄像头数据的提取分析、基于天气交通的物流优化等方面,大数据有着非常现实的需求。”近日,微软(中国)SQL Server高级产品市场经理郝雪莹到中国计算机报社就大数据做培训交流,介绍了微软眼中的大数据。
  大数据≠Hadoop
  不论大数据的特征到底是3V还是4V,因为有了互联网,有了社交化,有了云……企业的运营环境正发生巨大的改变。企业许多业务都需要捕获数量空前的数据,这些数据中包括大量的结构化和非结构化数据,为企业带来收益的同时,也给企业的数据收集、存储、处理提出了严峻的挑战,郝雪莹说。
  在无需承担构建复杂的分布式存储和计算集群的情况下,企业需要有效处理结构化和非结构化数据,以有效方式将内部和外部的数据及服务结合,从包括社交媒体在内的更多来源中挖掘、分析数据,并及时做出决策,并以用户熟悉的方式进行分析和展现。
  郝雪莹介绍,不能将大数据与Hadoop完全划等号。它只是实现大数据数据管理的一种工具,可以使用普通机器实现分布式处理复杂计算和数据,真正把数据用起来,还需要很多其它工具和平台的支持。
  在微软看来,大数据不是一种具体产品,而需要从数据全生命周期角度考虑, 它包含数据管理、数据丰富和数据洞察三个层面。数据管理,即如何获取、存储和保护数据;数据丰富,微软在Windows Azure的数据集市上为用户准备了丰富的选择,将第三方解决方案提供商、服务提供商或者是模块提供商和最终的商业用户的数据和应用联合在一起;数据洞察力,即通过分析、呈现与决策工具,获得洞察力,产生价值。微软现有的商业智能(BI)平台与协同、呈现工具的无缝结合,可以将大数据更好的可视化。
  管理、丰富、洞察大数据
  在数据管理层面,微软在Windows Server 和 Windows Azure上提供基于云或者内部服务的Hadoop服务——HDInsight,它构建于Hortonworks Data Platform之上,通过与System Center集成,HDInsight简化了Hadoop的管理,并支持IT部门在同一面板上管理Hadoop集群、SQL Server数据库和应用程序。微软还通过Active Directory使IT部门能够将同样一致性安全策略用于包括Hadoop集群在内的所有IT资产。
  “对于企业传统环境,SQL Server完全可以满足企业对关系型关键业务系统的管理需求,非关系型数据可由Hadoop集群来承担,对于企业自建Hadoop 集群,HDInsight on Windows Server可以满足这一需求。对于云环境,我们有HDInsight on Windows Azure, 结合SQL Server Parallel Data Warehouse(PDW),客户可以访问获取任何规模的任何类型数据。此外PDW 中的PolyBase沿用标准的SQL查询语句,可以实现就像查询关系型数据库一样跨Hadoop环境和数据仓库环境进行查询。另外对于实时的流数据,微软SQL Server中的StreamInsight可以快速处理。”郝雪莹细致地讲解道。
  在数据丰富这个层面,微软在Windows Azure上搭建数据集市,让数据的拥有者,也就是第三方解决方案提供商、服务提供商或者最终用户把自己的数据发布到数据集市上,让用户可以通过微软发布的一些非常简单可用的API或者工具,通过付费或者免费方式,把这些数据整合到他的应用环境中来支持应用。
  美国某汽车销售公司对各类汽车历年全国销售情况分析时发现,来自于数据集市的国际原油价格以及美国经济指标对汽车种类销量的影响非常明显。这说明,完成一项应用分析不只需要客户自己的数据,而需要更多参考数据,开放、共享的数据集市非常重要,微软正和更多的合作伙致力提供更多更完备的数据集市应用,现在可以看到的包括畅捷通、ESRI等。
  “近日,微软研究院专家David Rothschild非常靠谱地预测了第85届奥斯卡金像奖奖项归属,这也是一个大数据非常典型的应用,他在建模分析时采用了由社交媒体Twitter产生的用户数据,结果也可以算是民心所向。”郝雪莹说,微软提供了全面而且丰富的BI工具,为数据的整理与展现提供丰富的工具,客户可以使用熟悉的工具如Excel、Sharepoint Server、PowerPivot和Power View等以各种形式分析并展现来自于大数据平台的各种类型的数据,包括非结构化数据。
  “值得强调的是,企业需不需要大数据要看实际需求。微软为客户使用大数据提供包括管理、丰富、洞察全面的端到端平台, 客户也可以利用已有的和熟悉的产品和技术,如 SQL Server、Office等,使公司在处理新业务时能充分利用原有IT投资。”郝雪莹总结道。
其他文献
据有关媒体近日报道,公安部发布消息称将加快身份证登记指纹信息的工作。目前,全国已有1.6万多个派出所启动了居民身份证登记指纹信息工作,今年年底该工作将在全国全面铺开。  和已经退出历史舞台的一代身份证相比,现在我国居民使用的身份证(二代身份证)采用非接触式IC卡技术,具备视读和机读两种功能,专用芯片采用数字防伪措施,已经有了很大的技术进步。  然而,二代身份证的缺陷仍然存在,即丢失后的身份证无法注
寿光环球软件科技有限公司是通过国家双软认定的高新技术企业,是山东飞翔软件产业集团旗下领军企业。环球软件可协同为全球客户提供一流的软件技术服务,是业内领先的IT整体解决方案和服务提供商。  寿光环球软件科技有限公司(环球软件)隶属于潍坊科技学院,是通过国家双软认定的高新技术企业,是山东飞翔软件产业集团旗下领军企业。主营业务为软件研发、系统集成、教育培训、服务外包。公司成立于2004年9月,前身为中国
“知行合一,行胜于言。”这句话在中国大数据市场上得到充分体现——IBM和牛津大学共同发表的研究报告《分析:大数据在现实世界中的应用》显示,25%的中国企业已经开始进行大数据实践,56%的中国企业正在计划部署大数据。  面对中国大数据市场的蓬勃发展和实际需求,IBM不断加大对中国市场的投入,以领先的大数据与分析技术促进大数据在零售、银行、电信、医疗、制造和互联网等诸多行业落地,这与企业对大数据应用的
时间 2013年6月27日  地点 九寨沟喜来登酒店尔玛厅  人物 HDS公司首席运营官(COO) Brian Householder  HDS副总裁兼中国大陆与台湾地区总经理 庄国光  《中国计算机报》总编辑 张建设  6月27日,2013 HDS大中华区CIO峰会在旅游胜地九寨沟举行。会上,HDS公司首席运营官(COO)Brian Householder回顾了公司过去几年的发展,其中特别提到H
在企业级基础平台市场,ARM刚刚与x86形成了如火如荼的竞争之势,却又出现了新的竞争者前来搅局。  近日,IBM宣布与Google、Nvidia、Mellanox及服务器制造商Tyan(泰安电脑)组建OpenPOWER联盟,联盟成员将获得IBM Power微处理器技术架构的设计授权,他们可开发自己的Power芯片,用于服务器、网络和存储设备中。  x86在企业级市场份额不断增长的同时,Power也
8月22日,在第三届中国计算技术大会的“大数据创新与实践”分论坛上,软通动力信息技术(集团)有限公司(简称“软通动力”)高级副总裁、创新研究院负责人倪敦和与会者分享了软通动力眼中大数据的智慧商机,并在随后的独家采访中与《中国计算机报》记者分享了更多的实践心得。  大数据新机  倪敦介绍,软通动力已从传统的外包服务商转型为通过新技术创新服务的提供商。在转型创新的过程中,软通动力一直关注大数据技术,并
赛门铁克近期对全球1400多名IT专业人士进行的一项调查显示:如果备份的速度能够提高一倍,72%的受访者愿意更换新的备份产品;28%的受访者表示,他们现有的备份工具种类过多,用于物理系统和虚拟系统保护的备份软件平均分别为4种和3种。上述调查结果表明,用户希望持续改进备份软件的性能以及可恢复性,同时还希望借助集成度更高的方案解决所有与备份有关的问题。  备份速度提高100倍   为了实现业务的连续
2012年中国软件行业创新奖  博雅英杰将实用科学与计算机技术、物联网技术、物流信息技术、生物识别技术有机结合,获得了多项专利。  北京博雅英杰科技股份有限公司(以下简称博雅英杰)依托于北京大学人力和技术资源,注册于北京市海淀高新科技园区。博雅英杰是国内唯一一家把中国实用法学与当今最先进的计算机技术、物联网技术、物流信息技术、生物特征识别(指纹、人脸特征比对)技术和无线通信技术进行有机结合且获得多
郎酒集团预计在2013年通过致远协同办公系统处理业务400万次,调用业务单据80万张,由此节约纸张费用约100万元。  协同办公系统的价值正在被越来越多用户所认可和验证,而软件供应商也在根据新的技术趋势和新的应用需求不断完善相关的产品和解决方案。  以人为中心  9月5日,在致远V5协同平台及新品全国巡展北京站现场,致远软件公司(简称致远软件)助理总裁兼北京区总经理王化福指出,无论是公共事业单位还
“我已经不再是一个PC厂商”,这是戴尔在转型之路上不止一次释放出的明确信号。从前端PC业务的一枝独秀到后端数据中心解决方案的全线覆盖,可以看出,企业级市场正是戴尔转型的核心方向,其重要性无出其右。  实际上,戴尔向“端到端解决方案供应商”迈进的转型大幕早在几年前就已经拉开。过去几年中,戴尔收购了多家企业级产品供应商,快速构建起了比较完善的信息基础架构。在存储领域,迈克尔·戴尔与EMC“十年联姻”的