论文部分内容阅读
近年来,随着我国社会经济飞速发展和金融改革的不断推进,社会财富的增长和资产管理需求的增加,为银行业发展提供了重要机遇。面对日益激烈的行业竞争,银行业不断提升自身业务能力,科技含量高、专业性强的新产品、新服务层出不穷。随着对产品的设计要求和管理要求不断提高,服务渠道的不断拓宽、以及业务流程不断优化,银行应用系统更新换代频繁,越来越成为银行业务发展的核心。与此同时,应用系统的可用性、可靠性和服务能力也越来越受到重视。而伴随着银行业务的快速发展和新系统的陆续投产,应用体系日益庞大,应用设计、系统架构复杂度也越来越高,功能之间的关联性越来越密切。在这种紧密关联的复杂架构中,任何环节出现故障,都可能导致整个体系的可用性降低,甚至崩溃,严重影响银行的服务质量,生产运行维护的压力也越来越大。[1]以某商业银行为例,截至目前该行数据中心侧生产上运行的各类应用系统已达200多个,各类服务器设备近4000台,其中部分应用系统在全球范围内支持7*24小时的连续性业务运营。在这种情况下,如何确保行内应用系统运行的稳定性、可靠性,保证对外提供高水准的服务水平和高峰访问条件下的高处理性能,是大数据时代背景下一流的数据中心生产管理必须面对的课题。如果能够构建一个高度自动化的应用监控管理工具,提供准确高效、覆盖全面的生产运行实时监控,及时预防和发现应用系统在运行过程中存在的故障和隐患,保持应用系统的持续稳定运行,将有效提高商业银行的运维管理能力,主要体现在以下几个方面:1、提升IT监控的信息化水平。通过应用系统运行情况的自动化监控,与配置管理、问题管理、变更管理等生产运维系统的实时联动,提升生产运维自动化水平,克服手工维护带来的种种问题,提升运维人员和生产管理人员对全行生产运行的控制和监管能力。2、提升信息科技风险防范能力。应用监控系统可以有效促进生产运行监控从被动型向主动型、由应急型向预防型转变,极大提升监控管理的规范性,提高生产运行的可靠性和运行效率,有效防范信息科技风险。[2]3、提升IT运维服务质量。通过大屏幕展现、声音报警提示、邮件通知、短信提醒等多维度监控、展现计全行生产运行状况,便于运维人员做到提前预防、及时排障、及时响应、快速处理,自动化监控代替人工定点监控,节约人工成本的同时大大降低了由于手工操作可能带来的误操作,提高了系统检查效率,从而进一步缩短对外服务影响恢复时间。本文从某商业银行的全行监控体系入手,介绍全行监控体系的总体结构、监控范围和对象的划分,并以其中一个专业监控子系统--应用监控系统为例,重点介绍该系统的设计思路和实现过程,其中对主要功能模块的具体实现包括业务逻辑、处理流程、接口实现、表结构设计、展现页面等均进行了详细介绍。该系统的投入使用实现了对全行应用的联机交易、批量作业运行、应用系统服务可用性等方面的实时监控,其监控事件的有效识别和灵活的通知处理方式为生产问题的及时发现和快速处理提供了有力帮助,而监控结果的多样化展现和多维度的数据统计分析为技术人员的后台分析和系统优化提供了有效的数据支撑;同时从原来的定时、定点的手工监控,改变为自动化的实时监控,减少了大量人力资源投入。该系统目前已经成为该商业银行保障生产安全稳定运行的重要工具之一。