大数据时代更需要数据治理

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:julykoko
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据治理在“大数据”成为热词后,更加被业界关注。大数据带来的一个显著变化是,大量数据来自于数据中心之外,包括笔记本电脑、平板电脑、智能手机以及传感器、社交网站等。数据量激增,数据类型也变得多样。数据散落在不同的系统中,哪些数据是可信的?数据是否面临更大的风险?如何从海量数据中获得洞察?大数据时代,企业更加需要数据治理。
  “数据治理是目前一个比较新兴的、正在发展的学科,目前业界对它的定义还不完全一样。”IBM全球企业咨询服务部业务分析与优化团队副合伙人谢国忠说,数据治理(Data Governance)是围绕将数据作为企业资产而展开的一系列的具体化工作。数据是企业最大的价值来源,同时也是最大的风险来源,数据管理不佳通常意味着业务决策效果不佳以及更可能面临违规和失窃。而利用规则的可信数据有助于组织的业务创新——提供更好的服务,提升客户忠诚度,减少合规及报表要求所需工作,并提升创新能力。
  国内企业数据治理成熟度不高
  “在过去几年中,数据治理的目标也在发生转变。”曾经帮助金融、航空、海关、电信、电网等行业客户做过数据治理项目的谢国忠表示,“除满足监管和风险管理要求外,现在很多企业在说怎么通过数据治理来创造业务价值。如信息披露、行业领先以及精细化管理的需求。”
  “目前国内大部分企业在数据治理方面还处于基本管理阶段。”谢国忠评价说,“有些公司说做了很多数据质量检查,做了数据归档、数据安全,但他们的问题是没有一个完整的体系。其次,怎么把这些领域串起来,他们没有方法论。第三,他们在观念上还达不到把数据当做核心资产来运作。”因此,谢国忠认为国内企业首先需要一套完整的数据治理体系。
  他认为国内企业数据治理方面存在误区:觉得数据治理是很短期的行为,认为数据治理只是IT部门的责任,只把数据治理当成软件。实际上,数据治理不光是软件,还要有相应的流程、方法。
  谈到数据治理的实践,IBM自身就是数据治理的典型代表。1992年之前,IBM在数据治理方面存在很多问题,没有明确的可依赖的数据源,没有明确的数据所有人,数据质量低下。1995年,IBM在ERP里面做了业务数据标准,将所有的业务定了15大类业务标准、79个分类子业务标准,这样全公司看到的是一个统一的业务定义。2004年,IBM成立了数据责任人论坛,2005年成立了数据治理委员会,之后又成立数据审核委员会。1992年,IBM全球有128个CIO、155个数据中心、80个Web拓展中心、31个不同的网络、16000个应用。通过数据治理,IBM简化了基础架构,并降低了管理的复杂度。2007年,IBM全球只有一位CIO,主数据中心变成了6个,Web拓展中心变成全球统一的网络,16000多个应用变成4000个左右。
  在此基础上,IBM在2004年联合业界多家公司和学术研究机构,成立了数据治理论坛,并在此次论坛上,制定包括四大领域11个要素的数据治理框架和方法,来指导数据治理工作的开展。框架包括产出领域:数据风险管理、价值创造;驱动领域:组织机构/流程、管理制度、数据责任人;核心领域:数据质量管理、信息生命周期管理、安全/信息披露/合规;支撑领域:数据模型/数据架构、元数据/主数据/数据标准、质量审计与报告。
  银行数据治理成功案例
  在数据治理方面,由于政策方面的驱动力以及银行自身业务发展的需求使银行数据治理需求旺盛。中国银行业信息科技“十二五”规划中包括数据治理与数据标准专题,其中指出“十二五”期间,数据治理需要重点推进的核心领域包括:数据标准、数据质量、数据安全、数据架构,以及为了做好这些工作所必需的保障机制,包括政策、组织、流程、技术等方面。
  IBM GBS部门帮助国内外银行做了多个数据治理的咨询项目,包括中国资产规模最大的商业银行。
  “这家银行与同行业相比在技术方面是最先进的,已经做了数据质量、元数据等,但没有完整、统一的数据治理方法和配套的制度、流程;另一个问题是数据治理体系和架构还不完善。”谢国忠向记者介绍了这家银行在数据治理方面面临的挑战。
  根据IBM数据治理框架和方法,GBS从四大领域11个要素对该行数据治理的现况进行评估,帮助该银行找到差距,并在此基础上分析问题,提出解决问题的建议。这一项目从2008年开始,2010年及2011年该行又相继启动了一系列相关的数据治理项目,包括全行数据标准化项目、数据架构优化项目、全行数据质量管理项目等。目前,该银行在数据治理方面在全国也走在前列。
  再看某全球领先银行的数据治理案例。美联储认为该银行没有对信息的整合和质量进行足够的控制以确保合规的要求。而通过一到两年的数据治理,该银行通过了美联储的审计。该银行的高级副总裁Andrew Dunn认为,该银行数据治理取得成功的关键因素是,选择了一个有相关经验、流程和工具的合作伙伴能够加速数据治理在整个企业范围内的有效部署。
  主数据管理需求突出
  数据治理涉及11个要素,主数据管理就是其中非常重要的一环。Informatica公司高级副总裁兼首席信息官Tony Young就说:“加强主数据管理是企业获得一个完整、可信的数据视图的必经途径。”
  主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单等。主数据管理旨在从企业的多个业务系统中整合最核心的需要共享的数据,集中进行数据清洗,并以服务的方式把统一、完整、准确的主数据分发给企业内的操作型应用和分析型应用,包括业务系统、业务流程和决策支持系统等。
  Tony Young向记者表示:“MDM最核心的任务是导出‘黄金数据’。所谓黄金数据就是企业的关键业务数据,也是绝对真实的数据。此外,MDM还要反映主数据之间的关联性,比如客户与产品之间的关系、客户与客户之间的关系等。在数据仓库里,你很难找到这种关联性,而MDM能够轻易做到这些。”MDM和数据仓库之间也有区别,比如它们处理的数据类型不同,MDM是偏交易型的系统,而数据仓库属于分析型的系统。MDM和数据仓库两者可以互相促进,互为补充。Informatica MDM 的灵活数据模型可让IT团队在任何数据域中实施MDM,并可在同一数据模型中添加其他域及定义不同数据域之间的关系。Informatica MDM 可在企业内部或云中实施,也可作为两者的混合体加以实施。此外,它还可以作为多个MDM实例之间的全局性枢纽,部署于联合MDM体系架构内。
  金融行业仍然是MDM需求最旺盛的行业,MDM资深专家、Information Difference公司总裁Andy Hayler表示:“一般来说,企业越大,遇到的数据管理方面问题就越多。大公司更容易采用相关的数据分析工具来解决其面临的数据问题。”但这并不是说MDM只适用于金融行业,比如Informatica公司的MDM产品已经在24个行业中得到了应用,包括医疗、石油、公共事业等行业。
其他文献
2010年世界杯足球赛期间,Twitter的多次大规模宕机事件让用户无法忍受;2007年,奥运票务系统因无法承受瞬间每小时800万次的流量而宕机;2006年,英国伦敦希思罗机场航站楼因应用缺陷致行李处理系统故障,积压行李达万件;近期,国内某银行核心业务系统发生故障,导致该银行包括柜台、网银、ATM机在内的所有渠道的业务停止4.5小时……   重开发、轻测试,让软件系统故障频发。  为什么经过测试的
随着以Isilon为代表的集群NAS厂商的兴起,NAS横向扩展(Scale Out)带来的种种益处让行业用户津津乐道。与传统的存储纵向扩展(Scale Up)方式相比,横向扩展架构在基础设施构建成本和运营成本方面都更加低廉。简单说,横向扩展架构带来的是更高的运营效率。    摆脱纵向扩展的束缚    企业战略集团(ESG)分析师Terri McClure表示:“2009年,大多数企业对横向扩展NA
这曾是一个颇为神秘的项目,即便是项目的实施公司,也一度并不知道自己的最终服务对象到底是谁,直到有一天,一条微博的出现。  那是在共和国国庆节的前一天,当瑞星公司上上下下还在为节前的扫尾工作而忙碌时,公司微博发布了一段话,让大家突然感到群情振奋而又无比自豪:“可上九天揽月,可下五洋捉鳖。‘天宫一号’上天背后,是千千万万航天人的努力,同时,包括瑞星在内的国内安全厂商,也给航天业带来了稳定和安全的信息环
由于磁盘备份的兴起,在备份领域,磁带产品逐渐边缘化。受磁盘备份产品冲击最大的是中低端磁带库市场。就是在这种情况下,昆腾推出了新一代智能化的中低端磁带库产品Scalar i40和i80。“很多中小企业用户的备份需求不高,数据的生命周期可能只有一个月,并不需要对数据进行长期保存。因此,只使用磁盘备份设备就可以满足备份的所有要求。”昆腾公司亚太区技术总监刘诚谦表示,“但是,随着磁带驱动器产品不断推陈出新
在经历了摘菜和抢车位等游戏引发的狂热之后,国内社交游戏玩家集体出逃,社交网站危机显现。  在商业价值和盈利模式的质疑声中,这些依靠游戏起家的Facebook模仿者们能否走出迷途?    随着抢车位、摘菜等社交游戏的火爆,社交网站(以下简称SNS)几乎在一夜之间红遍了大江南北。开心网的快速发展,更是给国内的从业者们注射了一针强心剂,于是在国内激起了SNS创业的狂潮,各种类型的SNS网站如同雨后春笋般
大家都知道,IT渠道商最重要的工作就是卖货,它开的每一家零售店面都要有一定的销量,获得相应的赢利才能生存。而体验店却不是以销售为目标。它更注重消费者的应用体验,希望借此提升品牌知名度和产品对消费者的黏性。因此,一般来讲,只有厂商才会考虑开设体验店。  腾创科技这家高速扩张的IT渠道商却改变了人们这种固有的看法。  7月11日,腾创科技(北京)有限公司旗下的易数易码联想北京旗舰店正式在北京鼎好电子商
2011年,新市场不断涌现。  不同屏幕大小的平板电脑争相亮相,超级本被越来越多的IT厂商拥抱,LTE浪潮拉动电信设备市场,云端安全逐渐成为产业发展的关键因素,本地服务营销成为新宠……  2011年,新应用层出不穷。  LBS(地理位置服务)形态千变万化,行业信息化与移动终端加速融合,大数据服务扬帆起航,手机支付慢慢深入人们的生活……  2011年,新模式应运而生。  社交商务改变着企业的办公方式
IT部门从以往的疲于应付各种应用故障,陷于事务性工作,到现在开始琢磨IT部门转型,计划将自身培养的工程师外包给其他企业做服务,鼎联控股有限公司IT部门的这种转变,只是因为合理地采用了一个IT自动化运维平台。  自动化运维平台的应用,正在改变着很多企业IT部门的运作模式。  令人苦恼的事务性工作  鼎联控股是我国第一家纳斯达克上市的水资源、市政、工业环保企业,致力于水资源及环保领域技术创新、建设投资
看过电影《画皮》、《夜宴》的朋友一定对其精美的海报记忆犹新,陈斐就是这些海报的创作者之一。近日,借着参加惠普经典A3打印设计汇的活动,记者采访了早晨设计合伙人、中国著名设计师陈斐,听他讲述了电影海报设计背后的故事,亲身体验了惠普Officejet 7000打印机在设计领域丰富的典型应用。  设计师是非常感性的人群,通常他们会被产品的工业设计和材质所打动。“惠普的这台机器,机身的转角处理是会让设计师
2011年,在虚拟化、大数据、云计算等技术和应用的推动下,存储正逐渐走向整合,无论是在硬件还是软件方面,一体化的趋势都越来越明显。  统一存储渐成主流  早在八九年前,NetApp已经推出了统一存储,将SAN与NAS巧妙地融合在一起。近两三年来,随着非结构化数据的急剧增长,企业用户对文件存储系统的需求量猛增。原来主要用于处理结构化数据的SAN存储已经不能完全满足用户的需求。  2011年,NAS存