论文部分内容阅读
中国石油吐哈油田是我国较大的陆上油田之一,经过多年企业信息化建设,逐步建立了涵盖油田公司各个单位、涉及油田所有员工的各类信息应用系统近百套,信息系统已经成为油田生产、生活、经营、管理必不可少的一部分。
不足的是,在网络及系统之上的应用层缺乏相应的监控告警手段,处于被动维护模式,无法从根本上保障各个应用系统的稳定运行,也无法在第一时间内获知应用系统的状态,往往是在用户告知后,信息中心才开始根据告知寻找应用系统故障。油田公司信息系统运维所面临的主要问题是缺乏以终端用户体验管理为纲、以应用性能管理为目的、以IT基础设施管理为基础的完整运维管理体系。
基于此,吐哈油田引进了以美国Compuware公司Vantage为基础的信息运维管理套件,参考中石油总公司、工信部、国家及国际组织信息建设、维护标准,建设了一套完整的吐哈油田信息系统运维管理系统。
业务应用
与用户体验双保险
为了让信息系统应用得更顺畅,吐哈油田信息中心采用了国际成熟、先进的模型来构建信息运维保障系统,目的是保证业务应用功能高效且稳定地实现。
首先是采用了强大的数据块技术,分别为基层技术、中层管理、高层决策等不同角色、不同层次的人员提供了个性化的信息门户。全方位、大纵深、多角度、积木式地展示整个油田各个业务部门信息应用系统、相关IT基础架构的实时状态,以及历史统计报表。
其次是通过自动化与手工相结合的建模引擎来保证业务逻辑与信息基础架构的有效关联,当应用系统性能下降或IT设备发生故障时,能迅速、精准、正确定位故障原因,并快捷、全面评估故障影响范围,引导相关部门根据事件轻重缓急来采取响应措施。
最后是多种数据采集接口将企业所有的信息管理工具软件、业务部门考核指标、流程规章管理制度,甚至场地安防管理等与信息相关的数据全部集成到统一的管理平台上。
而在用户体验保障方面,信息中心能通过网络端口镜像分析出用户操作在客户端、网络段、服务器端、页面生成等4个时段的精确用时与流量,7×24小时监测所有用户在所有地点对油田内部网络和业务应用的使用体验。
以用户体验监测为例,这套系统不仅能自动从IP地址、OA用户名、VPN用户名、Web网页用户名等监测用户访问应用系统每一个页面、每一个动作的响应时间与数据量,而且能够按页面访问组合来监测完整事务性能。具体到隔离故障区域,强大的多种数据专家分析模块可以综合分析多种数据源,对TCP/UDP/HTTP/HTTPS/DNS/SMTP等协议、VOIP质量、数据库查询、Exchange收发邮件、SAP GUI操作、XML/SOAP访问等等进行详细分析,在不干扰用户前提下准确隔离用户性能问题发生的具体区域,如客户端、网络、服务器端或者页面设计问题等。而通过优化运维流程,可以引导相关专业部门、人员根据用户体验监测主动优化业务应用,并利用系统报表以及灵活的数据挖掘接口DMI按照企业运维要求建立起持续优化的信息运维流程体系(如图)。
保障基础架构性能
与国内外多数网络系统综合管理软件类似,吐哈油田现有的网管系统重点要解决的是信息基础架构所涉及资源的监测管理问题,即对网络设备、服务器、数据库、存储设备等等IT基础架构的相关参数进行实时、定时、连续性监测,显示资源的逻辑拓扑结构以及物理地理分布图,并按某种逻辑进行业务关联等等。
在此基础上,吐哈油田新建成的运维保障系统将对基础架构所承载的业务系统进行端到端的性能管理监测,重点包括三方面。
一是在网络上,采用无干扰的探针方式对网络上的数据流量按照业务、协议、链路、设备进行解码分类并计算出应用响应时间,自动生成应用访问拓扑逻辑,评估系统运行效能,发现网上应用漏洞。
二是在服务器上,采用统一的管理模板和先进的专家经验库对业务性能相关的IT基础架构进行监测,包括各种硬件平台、操作系统、数据库、应用服务器、虚拟机服务器等等,降低技术人员对运维管理的学习难度,提高系统运行效率与排错能力。
三是在业务应用上,可以根据需要在生产环境中分布式部署代理程序,深度分析应用性能的根本原因,为软件开发人员提供精准的优化指导。
不足的是,在网络及系统之上的应用层缺乏相应的监控告警手段,处于被动维护模式,无法从根本上保障各个应用系统的稳定运行,也无法在第一时间内获知应用系统的状态,往往是在用户告知后,信息中心才开始根据告知寻找应用系统故障。油田公司信息系统运维所面临的主要问题是缺乏以终端用户体验管理为纲、以应用性能管理为目的、以IT基础设施管理为基础的完整运维管理体系。
基于此,吐哈油田引进了以美国Compuware公司Vantage为基础的信息运维管理套件,参考中石油总公司、工信部、国家及国际组织信息建设、维护标准,建设了一套完整的吐哈油田信息系统运维管理系统。
业务应用
与用户体验双保险
为了让信息系统应用得更顺畅,吐哈油田信息中心采用了国际成熟、先进的模型来构建信息运维保障系统,目的是保证业务应用功能高效且稳定地实现。
首先是采用了强大的数据块技术,分别为基层技术、中层管理、高层决策等不同角色、不同层次的人员提供了个性化的信息门户。全方位、大纵深、多角度、积木式地展示整个油田各个业务部门信息应用系统、相关IT基础架构的实时状态,以及历史统计报表。
其次是通过自动化与手工相结合的建模引擎来保证业务逻辑与信息基础架构的有效关联,当应用系统性能下降或IT设备发生故障时,能迅速、精准、正确定位故障原因,并快捷、全面评估故障影响范围,引导相关部门根据事件轻重缓急来采取响应措施。
最后是多种数据采集接口将企业所有的信息管理工具软件、业务部门考核指标、流程规章管理制度,甚至场地安防管理等与信息相关的数据全部集成到统一的管理平台上。
而在用户体验保障方面,信息中心能通过网络端口镜像分析出用户操作在客户端、网络段、服务器端、页面生成等4个时段的精确用时与流量,7×24小时监测所有用户在所有地点对油田内部网络和业务应用的使用体验。
以用户体验监测为例,这套系统不仅能自动从IP地址、OA用户名、VPN用户名、Web网页用户名等监测用户访问应用系统每一个页面、每一个动作的响应时间与数据量,而且能够按页面访问组合来监测完整事务性能。具体到隔离故障区域,强大的多种数据专家分析模块可以综合分析多种数据源,对TCP/UDP/HTTP/HTTPS/DNS/SMTP等协议、VOIP质量、数据库查询、Exchange收发邮件、SAP GUI操作、XML/SOAP访问等等进行详细分析,在不干扰用户前提下准确隔离用户性能问题发生的具体区域,如客户端、网络、服务器端或者页面设计问题等。而通过优化运维流程,可以引导相关专业部门、人员根据用户体验监测主动优化业务应用,并利用系统报表以及灵活的数据挖掘接口DMI按照企业运维要求建立起持续优化的信息运维流程体系(如图)。
保障基础架构性能
与国内外多数网络系统综合管理软件类似,吐哈油田现有的网管系统重点要解决的是信息基础架构所涉及资源的监测管理问题,即对网络设备、服务器、数据库、存储设备等等IT基础架构的相关参数进行实时、定时、连续性监测,显示资源的逻辑拓扑结构以及物理地理分布图,并按某种逻辑进行业务关联等等。
在此基础上,吐哈油田新建成的运维保障系统将对基础架构所承载的业务系统进行端到端的性能管理监测,重点包括三方面。
一是在网络上,采用无干扰的探针方式对网络上的数据流量按照业务、协议、链路、设备进行解码分类并计算出应用响应时间,自动生成应用访问拓扑逻辑,评估系统运行效能,发现网上应用漏洞。
二是在服务器上,采用统一的管理模板和先进的专家经验库对业务性能相关的IT基础架构进行监测,包括各种硬件平台、操作系统、数据库、应用服务器、虚拟机服务器等等,降低技术人员对运维管理的学习难度,提高系统运行效率与排错能力。
三是在业务应用上,可以根据需要在生产环境中分布式部署代理程序,深度分析应用性能的根本原因,为软件开发人员提供精准的优化指导。