论文部分内容阅读
摘 要:随着计算机信息技术的快速发展,近年来IT系统规模持续扩大已经成为我国各类企业的常态,基于此,本文首先分析了IT系统一体化运维监控及服务预警平台的建设需求,并详细论述了该平台的设计与实现思路,希望由此能够为相关业内人士带来一定启发。
关键词:IT系统;运维监控;预警平台
中图分类号:TP311.5 文献标识码:A 文章编号:1004-7344(2018)26-0326-01
前 言
资料信息分散、设备缺乏统一监控平台、缺乏运行健康情况评估手段和预警措施均属于较为常见的IT系统运与发展问题,随着企业IT系统规模的不断扩大,这类问题带来的负面影响也往往随之增长,而为了尽可能解决这类问题,正是本文围绕IT系统一体化运维监控及服务预警平台开展具体研究的原因所在。
1 建设需求
1.1 监测IT系统运行
结合我国现阶段企业IT系统面临的普遍性问题,本文研究的运维监控及服务预警平台需首先满足IT系统的运行监测需要,这一需要的满足需关注IT系统监控、故障处理、健康运行报告生成、运行事件响应等功能的集成,企业IT系统的业务连续性、健康度由此即可得到较好保障。为真正实现IT系统运行的监测,平台必须采用高效稳定安全的检测工作,同时还需要关注IT系统核心内容的全流程监控、监控结果的可视化展示、大屏集中式告警,故障点快速定位也应成为平台设计与实现所关注的焦点[1]。
1.2 保障业务连续性
随着大数据、云计算等技术的不断完善,我国企业的信息化进程不断加快,IT技术与业务的融合已经成为很多企业的常态,企业的稳定运行、长期可持续发展实现也需要得到IT系统的支持,因此IT系统的业务连续性保障理应成为本文研究平台的建设需求之一。在笔者的实际调研中发现,相较于IT基础设施故障,各类业务系统故障的发生更为频繁,因此平台建设需同时关注IT系统的业务运行层、应用系统层、基础设施层,以此更好为IT系统业务连续性保障提供支持。
1.3 管理业务容量
平台还需要具备管理业务容量的能力,该能力需通过分析工作负载、调整业务系统容量、调整业务时间实现IT系统的高水准运行,由此将单一、零散的业务数据进行趋势化整理,IT系统也将为企业运行发展提供更有力支持,业务的处理性能、处理量、各资源使用状况同样属于平台所关注的重点。
2 设计与实现
2.1 平台技术架构
为保证IT系统一体化运维监控及服务预警平台能够真正实现应用系统、安全产品、网络设备、计算机设备网上行为及运行状况的集中监控,并同时实现各类设备的全面集中统一管理,平台必须具备快速发现设备异常情况、快速定位故障并自动形成“工单”的能力,因此平台采用了三层架构设计,数据使用层、数据处理层、数据采集层将通过相互配合赋予平台事件告警、实时数据/故障诊断、历史数据分析等功能,而在管理控制台支持下,整个平台可实现各个层面的全方位配置管理,具体平台构成如下所示:①数据使用层。数据使用层也可以被称作展现层,IT系统监测数据查询、健康度巡检报表、全局视图属于数据使用层的主要构成,其中IT系統监测数据查询可通过日期、关键字查询IT系统历史运行情况,健康度巡检报表则能够通过重要设备、业务视图、告警统计、逻辑拓扑直观展示系统健康程度,全局视图则能够实时展示IT系统的监视与告警情况,同时全局视图所展示的信息还会自动记录于事件管理平台。②数据处理层。数据处理层的功能实现需得到相应的性能指标集支持,这里的性能指标集构建需结合监控对象特点及运维管理需要,由此围绕测量频度、预警阂值、计算方法、数据来源、测量范围等参数构建性能指标集,即可实时监测、分析IT系统性能,如发现系统出现超出预警阂值状况,数据处理层将传递相应信息至数据使用层。③数据采集层。作为平台的最底层,数据采集层主要负责故障数据、性能数据的采集,采集的实现需得到Agent部署、NSMP协议的支持,同时数据采集层还具备被动接收采集指令功能,平台的后续分析、数据挖掘实现由此即可得到保障[2]。
2.2 平台功能架构
结合IT系统一体化运维监控及服务预警平台的建设需求,平台选择了基于松藕合的体系架构,同时结合了云计算技术赋予结构部署灵活性,灵活模块化组装也将由此实现,而为了更好赋予平台“监控、管理、管控”的协同处理能力,平台功能架构由统一访问门户、集中监控管理中心、事件与性能管理平台、资源与指标管理平台、运维管理中心组成,具体组成如下所示:①统一访问门户。个人工作台、消息中心、个性化定制、大屏展示、用户权限管理、综合视图属于统一访问门户的主要功能模块构成,由此即可为不同用户提供针对性的辅助工具,满足其个性化使用需要与权限分级需要。②集中监控管理中心。综合展示、综合分析、综合报表、预警管理、告警管理、模型管理属于其主要功能模块,流量、拓扑、报表、性能等信息可由此实现多样化展示。③事件与性能管理平台、事件压缩、事件过滤、告警策略、告警处理、性能压缩、性能过滤属于该平台的主要功能模块,采集信息将由此实现初步处理。④资源与指标管理平台。模型管理、资源管理、自动发信、拓扑展现、模型管理、数据管理、定义管理属于平台主要功能模块,事件的统一处理将由此得以实现。⑤运维管理中心。服务台、计划作业、任务管理、自助服务、故障管理、变更管理等属于其主要功能模块构成,资源的高效利用和综合管理将由此实现。
3 结 论
综上所述,IT系统一体化运维监控及服务预警平台具备较高推广潜力,在此基础上,本文涉及的平台技术架构、平台功能架构内容,则提供了可行性较高的平台建设路径建议,而为了进一步提升该平台性能,各类新技术的应用探索需得到关注。
参考文献
[1]狄 刚.国家级“一带一路”投资平台信息化顶层设计的回顾与思考[J].金融发展评论,2018,02:1~8.
[2]陈志勇,李忠富,李 环.基于动态环境监测系统的新能源变电站管理方法的改进与创新研究[J].环境科学与管理,2018,4301:181~186.
收稿日期:2018-8-9
关键词:IT系统;运维监控;预警平台
中图分类号:TP311.5 文献标识码:A 文章编号:1004-7344(2018)26-0326-01
前 言
资料信息分散、设备缺乏统一监控平台、缺乏运行健康情况评估手段和预警措施均属于较为常见的IT系统运与发展问题,随着企业IT系统规模的不断扩大,这类问题带来的负面影响也往往随之增长,而为了尽可能解决这类问题,正是本文围绕IT系统一体化运维监控及服务预警平台开展具体研究的原因所在。
1 建设需求
1.1 监测IT系统运行
结合我国现阶段企业IT系统面临的普遍性问题,本文研究的运维监控及服务预警平台需首先满足IT系统的运行监测需要,这一需要的满足需关注IT系统监控、故障处理、健康运行报告生成、运行事件响应等功能的集成,企业IT系统的业务连续性、健康度由此即可得到较好保障。为真正实现IT系统运行的监测,平台必须采用高效稳定安全的检测工作,同时还需要关注IT系统核心内容的全流程监控、监控结果的可视化展示、大屏集中式告警,故障点快速定位也应成为平台设计与实现所关注的焦点[1]。
1.2 保障业务连续性
随着大数据、云计算等技术的不断完善,我国企业的信息化进程不断加快,IT技术与业务的融合已经成为很多企业的常态,企业的稳定运行、长期可持续发展实现也需要得到IT系统的支持,因此IT系统的业务连续性保障理应成为本文研究平台的建设需求之一。在笔者的实际调研中发现,相较于IT基础设施故障,各类业务系统故障的发生更为频繁,因此平台建设需同时关注IT系统的业务运行层、应用系统层、基础设施层,以此更好为IT系统业务连续性保障提供支持。
1.3 管理业务容量
平台还需要具备管理业务容量的能力,该能力需通过分析工作负载、调整业务系统容量、调整业务时间实现IT系统的高水准运行,由此将单一、零散的业务数据进行趋势化整理,IT系统也将为企业运行发展提供更有力支持,业务的处理性能、处理量、各资源使用状况同样属于平台所关注的重点。
2 设计与实现
2.1 平台技术架构
为保证IT系统一体化运维监控及服务预警平台能够真正实现应用系统、安全产品、网络设备、计算机设备网上行为及运行状况的集中监控,并同时实现各类设备的全面集中统一管理,平台必须具备快速发现设备异常情况、快速定位故障并自动形成“工单”的能力,因此平台采用了三层架构设计,数据使用层、数据处理层、数据采集层将通过相互配合赋予平台事件告警、实时数据/故障诊断、历史数据分析等功能,而在管理控制台支持下,整个平台可实现各个层面的全方位配置管理,具体平台构成如下所示:①数据使用层。数据使用层也可以被称作展现层,IT系统监测数据查询、健康度巡检报表、全局视图属于数据使用层的主要构成,其中IT系統监测数据查询可通过日期、关键字查询IT系统历史运行情况,健康度巡检报表则能够通过重要设备、业务视图、告警统计、逻辑拓扑直观展示系统健康程度,全局视图则能够实时展示IT系统的监视与告警情况,同时全局视图所展示的信息还会自动记录于事件管理平台。②数据处理层。数据处理层的功能实现需得到相应的性能指标集支持,这里的性能指标集构建需结合监控对象特点及运维管理需要,由此围绕测量频度、预警阂值、计算方法、数据来源、测量范围等参数构建性能指标集,即可实时监测、分析IT系统性能,如发现系统出现超出预警阂值状况,数据处理层将传递相应信息至数据使用层。③数据采集层。作为平台的最底层,数据采集层主要负责故障数据、性能数据的采集,采集的实现需得到Agent部署、NSMP协议的支持,同时数据采集层还具备被动接收采集指令功能,平台的后续分析、数据挖掘实现由此即可得到保障[2]。
2.2 平台功能架构
结合IT系统一体化运维监控及服务预警平台的建设需求,平台选择了基于松藕合的体系架构,同时结合了云计算技术赋予结构部署灵活性,灵活模块化组装也将由此实现,而为了更好赋予平台“监控、管理、管控”的协同处理能力,平台功能架构由统一访问门户、集中监控管理中心、事件与性能管理平台、资源与指标管理平台、运维管理中心组成,具体组成如下所示:①统一访问门户。个人工作台、消息中心、个性化定制、大屏展示、用户权限管理、综合视图属于统一访问门户的主要功能模块构成,由此即可为不同用户提供针对性的辅助工具,满足其个性化使用需要与权限分级需要。②集中监控管理中心。综合展示、综合分析、综合报表、预警管理、告警管理、模型管理属于其主要功能模块,流量、拓扑、报表、性能等信息可由此实现多样化展示。③事件与性能管理平台、事件压缩、事件过滤、告警策略、告警处理、性能压缩、性能过滤属于该平台的主要功能模块,采集信息将由此实现初步处理。④资源与指标管理平台。模型管理、资源管理、自动发信、拓扑展现、模型管理、数据管理、定义管理属于平台主要功能模块,事件的统一处理将由此得以实现。⑤运维管理中心。服务台、计划作业、任务管理、自助服务、故障管理、变更管理等属于其主要功能模块构成,资源的高效利用和综合管理将由此实现。
3 结 论
综上所述,IT系统一体化运维监控及服务预警平台具备较高推广潜力,在此基础上,本文涉及的平台技术架构、平台功能架构内容,则提供了可行性较高的平台建设路径建议,而为了进一步提升该平台性能,各类新技术的应用探索需得到关注。
参考文献
[1]狄 刚.国家级“一带一路”投资平台信息化顶层设计的回顾与思考[J].金融发展评论,2018,02:1~8.
[2]陈志勇,李忠富,李 环.基于动态环境监测系统的新能源变电站管理方法的改进与创新研究[J].环境科学与管理,2018,4301:181~186.
收稿日期:2018-8-9