可视化——IT运维的关键

来源 :计算机世界 | 被引量 : 0次 | 上传用户:zhaoml0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “只有可见的,才是可运维的。”这是IT运维人员常说的一句话。
  然而现实往往并不能如愿以偿,过去的很长一段时间内,企业IT团队的精力往往都放在应用系统的建设上,工作重心多是完成一个又一个项目,很少真正对所有的应用系统做详细的梳理、弄清楚其中的逻辑关系。再加上早期开发的一些应用系统并没有建立良好的开发和运维流程,应用系统之间的关联关系也往往没有规范的文档可以查询。这样久而久之,随着运维人员的交替,支撑企业业务的应用架构已经变得难以梳理,IT运维面临的压力也越来越大。
  而在众多信息化建设开始较早的企业中,这种情形尤为明显,一方面是由于建设时资源紧张等特殊因素,某台服务器上可能运行着多个不同的应用程序,或者有一些边缘组件平时不太引人注意。这些问题伴随开发人员的更替,逐渐被人们淡忘,为后来的运维工作埋下了隐患,国内某大型商业银行便是这方面的典型案例。
  应用可视化是关键
  为此,该银行开展了相应的治理工作,以清除IT运维工作中存在的死角。该项目负责人姜岩在接受采访时表示,由于运维人员的不断交替,对整个应用系统缺乏清晰的认识是运维工作面临的最大难题。
  显然,如果没有一种有效的梳理手段支撑,企业要解决应用梳理问题,无疑是一项充满挑战的工作。特别是在业务与IT系统越来越紧密关联的趋势下,业务运行会很依赖IT系统的支持,如果缺乏对IT架构的理解,每一个未知风险都可能导致业务的严重中断;另一方面,业务快速变化也对IT运维的敏捷性提出了前所未有的要求,运维人员只有对IT架构保持充分的了解,才能让IT跟得上业务变化的节奏。因此,如今的运维人员已经不能仅满足于知道有哪些应用和节点部署在企业中,更需要知道它们之间是如何连接和交互的。
  为此,姜岩和他的团队尝试过多种方法,比如使用Agent模式、日志分析、代码植入等方式,不过效果并不尽如人意。由于这些方式直接与被管理系统、应用程序产生交互,也就是说其在监视数据产生的同时,本身也会消耗系统、应用程序资源,而这往往会导致资源紧张,进而导致业务处理性能下降,甚至有不少用户因此而遭受了严重的业务中断故障。
  在经过多方考量后,最终他们采用了基于网络数据资源的应用性能管理方法,使用CrossFlow BPC(Business Performance Center)网络与应用性能管理产品进行应用梳理,并进行相关的监控管理。
  而之所以采用这样的方式,也是因为在当前的应用架构下,应用服务层级划分已十分清晰,各层级间的交易全部通过网络传输来完成,基础设施和交付设施本身都以服务为中心向应用提供界限明确的服务功能,使得数据采集设备可以轻松获取关键交易环节的网络数据,这给网络数据源的获取带来了极大的便利和灵活性。
  据姜岩介绍,整个项目的实施主要有五个关键步骤,包括应用整体监控的标准化制定;监控统一管理的必要性分析;明确监控统一管理的主要目标;掌握监控统一管理的关键技术及监控统一管理最终如何展现与运用。“整个项目的关键词就是整体、统一。”姜岩解释说,只有做到整体监控、统一管理,才能使IT系统可视化,运维工作才能得心应手。
  整体监控 统一管理
  在具体的实施过程中,姜岩首先对现有应用系统的整体构成做了全面了解、仔细排查,包括哪些应用是跨节点、跨层面的,哪些应用是多维度的;然后按照应用构成信息的不同(不同应用的基础层面构成信息、应用内部构成信息、应用外部关联信息等都不尽相同),设定不同的KPI监控指标,再根据相应的指标分发相应的监控策略。姜岩表示,这样做的好处就是可以全方位多维度地梳理应用监测点,并以体系化的监控指标作为分发策略的参考。在此基础上,构建起了三层架构的监控统一管理平台,其中包含监控对象及代理层、监控工具层及监控管理平台,进而对应用产生的数据进行采集、处理、监控及管理。
  其中作为数据采集的关键,中间层的监控工具层起着至关重要的作用。因此,据姜岩介绍,他们前后部署了多个监控工具用以监视各个部件的情况,有针对惠普小型机监控的OVO、针对网络事件监控的SORLAWINDS、针对IBM小型机监控的TIOVLI、针对数据库监控的OMS、针对应用性能整体监控的CrossFlow BPC及针对存储环境监控的SOC等。
  其中针对小型机、存储、网络的监控工具主要监控的是单一类型的系统,而针对应用性能监控的CrossFlow BPC则能在一定程度上起到全局监控的作用。因为当系统中的某一应用出现故障时,CrossFlow BPC能够及时发现,并追根溯源,进行自动故障定位,在呈现应用故障对用户体验影响的同时,指出导致问题发生的根源组件和原因。
  CrossFlow BPC能够通过交易笔数、成功率、响应时间、响应率及返回码5个指标及交易时间、交易笔数2个维度对关键业务指标进行统计,并进行深入的分析。而其内置的SPV Discovery还能自动呈现被监控网络数据的IP连接性,快速梳理应用组件之间的逻辑访问关系。
  也正是由于以上的种种特性,姜岩使用其对银行的核心业务进行监控,通过关键交易当前的状态分析、性能趋势对比、交易直接探测等措施,明确当前的各项交易处于什么状态、有无威胁,并通过CrossFlow BPC梳理各项应用之间的逻辑关系,降低人为出错的可能性。
  在实际环境中,当其中某项业务出现故障时,CrossFlow BPC会以明显的颜色加以区分,并告知故障定位及告警数目,以方便用户做进一步的故障判断。
  据姜岩介绍,通过上述一系列的应用梳理,数据采集、处理、分析工作,并在监控统一管理平台统一呈现,最终实现了应用整体监控的既定目标,即在应用整体结构管理方面,能够梳理应用整体结构,达到自动实时监测;在应用健康运行监视方面,做到实时采集并监测应用运行的状态;在应用运行故障预警方面,实时分析并监控应用运行的关键KPI;在应用运行故障报警方面,实时自动检查应用服务状态的异常情况;在应用故障原因分析方面,采集故障现场数据,并进行关联数据分析。
  如今,通过新建立的监控统一管理平台,姜岩的运维工作已经变得得心应手。姜岩表示,现在通过总行的告警监控视图,运维人员可以轻松查看各个部分的运行情况。当某一部分出现故障时,通过整体报警消息,运维人员可以做到快速接管、准确检查、全程跟踪并及时通报。
其他文献
3月8日,中国联通再度举办“珠江论道·2012微博精英之夜”,为“红围脖”造势,来自全国各地的微博精英围绕微博,对移动互联网时代生活做了畅想。  红围脖,意指“红微博”,和此前广东移动推出的“红段子”业务似曾相识,皆为语带双关。用广东联通产品创新部副总经理李韩的话说,“红围脖”联盟通过平台化资源整合,为“红围脖”用户持续创造价值、提升价值,继续昭显“红围脖”积极向上、匡扶正气的精神,为微博社会的健
甲骨文创始人拉里·埃里森桀骜不驯到什么程度呢?9月25日,甲骨文全球用户和合伙伙伴大会把整个加利福尼亚州都带动得热情如火,这里的人们还有幸目睹了其竞争对手SAP雇佣的5架飞机在天上喷出SAP HANA字样来打击甲骨文的气焰。就在这样的氛围里,拉里为了看一场他喜欢的美洲杯帆船赛,取消了在大会上的主题演讲,让一名产品研发副总裁去救场子。  面对如潮的批评声,拉里说,别吵了,看我们推出的新产品、新技术如
微软诞生在PC革命之初,它赋予了人们获取计算能力的便捷方式,也因此微软奏响了胜利的凯歌。  而今天,移动革命的到来,让人们可以随时随地完成工作,而且都让一切充满个性,每个人都可以享受自己喜欢的方式。但这一次,微软却没能拿到胜利的桂冠。为什么在这第二次科技革命中,微软没能改变方式占得先机呢?  早期的微软,是非常非常关注用户的,但上世纪90年代末的反垄断诉讼却成了转折点。2001年11月,微软和司法
“会展的准备工作已经到了最后阶段,剩下的都是琐碎收尾的工作,但是,由于展会的面积比去年扩大了一倍,占国家会议中心的两层,因此我们的工作量还是非常大的。”杨胤在接受本报专访时说。1998年开始从事会展工作的她,目前就职的IDG爱奇会展有限公司是2013 Macworld|iWorld Asia博览会(以下简称“ Macworld博览会”)的主办方,这一展会在北京已经举办两届,而作为总经理,杨胤在组织
“云计算对Linux而言,是一个好的市场机会,云计算市场的繁荣必将推动Linux的进一步普及。”Novell大中华区及韩国总经理张先民博士告诉本报记者。张先民认为,就Linux的整体市场而言,目前是一个非常好的阶段。这也是在过去了一年里,Novell公司虽然发生了重大变化,但Novell在中国市场表现依然很亮丽的重要原因。去年,Novell公司被Attachmate公司整体收购,随后原来的产品被分
把各类制造资源和制造能力虚拟化、服务化,构成服务云池,企业通过终端和网络接入服务云池,就能随时按需获取想要的制造资源和制造能力,服务于自己的制造流程。中小制造企业不用再担心软硬资源和技术经验积累不足,想制造什么产品都能在“制造云”里找到支持,制造业将因此整体步入个性化、智慧化的制造阶段,实现革命性的跨越发展。这不是凭空想象,而是正在到来的现实。  两年前的德国汉诺威工业博览会上,出现了“工业4.0
近日,微软个人云存储服务——微软网盘SkyDrive完成了全新升级,其更新内容包括:与本地电脑操作体验一致的强大文件管理功能;基于以应用为中心的多种文件共享方式;全新Office Web App支持直接分享、多人协同在线编辑文件以及针对不同厂商不同操作系统设备的访问支持。SkyDrive自2007年面世以来,已经经历了7次更新,“这是微软产品中更新最频繁的一款产品。”微软MSN (中国)副总经理陈
医卫:区域医疗、远程会诊、移动医疗将成为三大投资重点  医卫行业信息化建设投入已经进入理性状态,将呈现平稳增长趋势。2012年中国医卫行业的IT投资规模约为190亿元人民币,较2011年同比增长25.5%。  区域卫生信息平台建设将继续是2012年医卫行业工作的重点之一。基于健康档案的省辖市级和县(市)级区域卫生信息平台,是国家卫生信息化发展总体规划所确定的三级平台建设总体框架中的核心和枢纽;是实
本报综合消息 2月14日,工业和信息化部发布《物联网“十二五”发展规划》。“十二五”期间,物联网发展的目标为:到2015年,我国要在核心技术研发与产业化、关键标准研究与制定、产业链条建立与完善、重大应用示范与推广等方面取得显著成效,初步形成创新驱动、应用牵引、协同发展、安全可控的物联网发展格局。  《规划》中指出,物联网发展的主要任务包括大力攻克核心技术、加快构建标准体系、协调推进产业发展、着力培
互联网化、互联网成为中国的基础设施、互联网正在改变中国的经济结构……这些从五六年前我们就经常挂在嘴边的词句,终于在2012年扎实地落地了。  从消费者的角度而言,互联网借由移动智能终端的普及,从家庭、办公室等固定化的场所中延展开来,形成随时、随地、随身的网络覆盖,消费者正在经历深刻的数字化改造,成为真正意义上的数字消费者。2012年,智能手机保有量超过20%,预计到2013年将超过50%,这也进一