论文部分内容阅读
摘 要:本文介绍了上海科技网作为一个IDC运营商,为提高IT运维管理效率,决定布置实施ITSM管理平台前,做的准备工作,包括管理目标确定,ITIL体系文件建立,SLA框架协议制定,CMDB设计等等,希望能够为业界广大准备通过ITSM管理手段来提高IT服务与运维管理效率的公司提供参考。
关键词:ITSM;ITIL;前期工作;运行优化
1 现代企业面临的IT服务管理困境
随着企业规模发展与壮大,IT服务越来越受到重视,几乎所有企业发展到了一定规模,都会设立IT服务部门,但由于没有规范的流程作为指导,现阶段国内大部分企业的IT服务管理面临以下3个困境:
一是IT基础设施的可靠性,由于企业IT基础设施牵涉面广,涉及软硬件,系统,应用,数据库等各个层面.即使单个系统稳定性达到3西格玛水平(99.9%),IT服务整体故障时间依旧会达到年均10天以上,远远不能满足现代企业对IT系统稳定性的要求.二是企业IT部门处于被动运维角色,也就是被动应付故障发生,进行排障处理.而在平生缺乏主动性监管与风险控制;第三就是企业的IT管理过度依赖掌握核心技术资源的关键员工,缺少相应的流程和知识积累,一旦人员流动,IT服务质量会大幅下降。
解决上述IT管理困境,国际国内广大IT服务提供厂商,专业机构都在积极寻找综合解决方案,ITSM就是被实践证明行之有效的方法论。
2 ITSM与ITIL
ITSM称为”IT服务管理”,它是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的高质量方法。它结合了流程、人员和技术三大要素---标准流程负责监控IT服务的运行状况,人员素质关系到服务质量的高低,技术则保证服务的质量和效率。这三大关键性要素的整合使ITSM 成为企业IT管理人员管理企业IT系统的法宝和利器。
ITIL是IT服务管理领域的一个最佳实践框架,ITIL(IT Infrastructure Library)是CCTA(英国国家计算机和电信局)于20世纪80年代末开发的一套IT服务管理标准库,它把英国各个行业在IT管理方面的最佳实践归 纳起来变成规范,旨在提高IT资源的利用率和服务质量。目前已经成为业界通用的事实标准。它是一套协同流程(Process),并通过服务级别协议(SLA)来保证IT服务的质量。它融合了系统管理、网络管理、系统开发管理等管理活动和变更管理、资产管理、问题管理等许多流程的理论和实践。ITIL把IT管理活动归纳为一项管理功能和十个核心流程,主要为:服务台,事件 问题 配置 变更 发布 服务级别 可用性 连续性 能力 财务。
3 上海科技网IT运维管理需求
上海科技网是上海市独立的宽带城域网与IDC运营商,云计算服务提供商.公司目前经营着一张光缆总数超过2000km,节点遍及上海全市的宽带城域网,拥有两个总量超过3000个机柜的数据中心,同时大力发在大数据,云计算服务业务。不同形态的IT业务蓬勃发展.对IT运维工作提出了严峻的挑战。
公司业务的发展,需要全面提升IT运维服务管理水平。针对IT管理与客户需求,上海科技网提出IDC网络服务可靠性达到99.99%,基础电力服务可靠性达到99.999% 为达到这个指标,要求科技网有一套系统,高效,稳定的IT管理方法,基于这个认识,布置与实施ITSM管理平台,并通过平台运作来提高运维管理服务水平,最终提高客户对上海科技网IT运维服务满意度。成为公司上下的共识。
大量的研究和企业实践表明,在ITSM项目的生命周期中,大约80%的时间与前期准备,后期项目运营维护有关,而该阶段的投资仅占整个项目投资的20%,在经常出现的问题中,源自技术或产品方面的其实只占了20%,而流程失误方面的占40%,人员疏失方面的占40%。这就说明,决定IT服务质量的,更多的不是来自技术于软件平台,而是来自企业内部管理水平。一个组织表现出来的IT服务能力高低犹如冰山露出水面那一部分,但真正起到决定性作用的却是那水下的80%。对于IT服务组织来说,流程驱动和人员角色构成了拿水下的80%,技术使用则是那水面上表现出来20%,这就是ITSM领域的二八法则。我们可以得出以下结论:
(1)ITSM项目建设是不为仅仅上一套ITSM软件。
(2)流程的梳理、人员团队的管理、管理体制和规则的建设才是重中之重;
(3)技术服从于管理体系、服务于管理体系,技术的选择应与管理体系配套、保持一致。
所以我们看到,项目前期的IT运维体系建设,流程设计,CMDB建设,以及SLA服务保障协议的制定等具体工作才是真正的重点。而ITSM工具是为了正常有效运作这些流程的运作服务的。
有了上述认识,科技网在实施ITSM项目前,做了大量准备工作,具体工作如下:
4 确定管理目标落实ITIL管理理念
公司首先成立了,ITSM项目组,通过问卷调查,现场访谈,头脑风暴,专家讨论等等各种方式,结合上海科技网实际IT业务管理模式的梳理,公司发展规划,以及客户对科技网服务的需求,首先确定了上海科技网IT运维服务管理目标。
上海科技网IT运维管理目标:以规范、高效的方式进行IDC服务管理工作,持续改进服务管理质量,提高客户满意度,力求使上海科技网成为客户首选的IDC服务提供商,拟从以下方面利用管理系统进行整合,对公司的IT管理进行提升:
(1)建立规范的服务流程,提高IDC运行效率和质量;
(2)以客户为中心,提高IT服务质量和客户满意度;
(3)有效且高效地整合基础架构、信息、人员及IT资源;
(4)建立持续改进的服务管理机制,有效控制服务管理的全过程。
确立公司管理目标之后,上海科技网以ITIL理论为基础,结合实际IT服务管理活动,形成一套自上而下的统一的IT服务管理理念。一方面,使科技网服务管理活动更加规范且有理可依;另一方面,统一步调,使IT服务管理方面的制度决策能够得到良好的贯彻和执行。在建立ITIL理念的基础上,全面制定ITIL 标准的文件体系,并在IT管理中贯彻ITIL标准,则是ITSM具体实施准备工作的第一步。 5 ITIL V3标准的体系文件建立与SLA的制定
前文我们已经提到,ITIL的核心是协调流程,通过SLA来管理服务质量。部署ITSM,第一步工作是将公司IT管理纳入ITIL标准体系,首先在公司层面建立了,,作为指导性一级文件,同时按照ITIL流程管理要求,建立 供应商管理,能力管理,配置管理,发布管理,服务评审管理等15个部门二级。以及数据中心管理制度,信息安全制度,故障处理流程等10个部门内部三级文件,将上海科技网IT运维管理纳入ITIL标准体系。
SLA:Service-Level Agreement,意思是服务等级协议。是关于网络服务供应商和客户间的一份合同,其中定义了服务类型、服务质量保障与未达到服务质量承诺时的赔付等等。SLA是ITIL 体系的两大核心之一,针对科技网业务特点以及对用户服务等级,科技网制定出针对一般用户的普通SLA,以及特殊需求用户的VIP SLA。主要包括以下几点
(1)基础网络可用率;
(2)基础电力可用率;
(3)环境温湿度报障;
(4)业务响应时间;
(5)故障恢复时限。
首先科技网针对普通用户,制订了SLA框架协议,承诺基本的服务质量保障,如基础网络可用率99.9%。基础电力可用率99.99%,故障恢复时间4h以内等等,这是框架SLA是科技网基本的服务承诺,附与每一个普通用户合同之后,与用户签订。
针对某些VIP客户对网络质量,基础设施,机房温湿度等具体条件的特殊保障要求,签订VIP业务 SLA,服务承诺与客户协商决定。
SLA 签订后,公司成立服务评审委员会,定期对SLA实行情况进行评审与改进。
6 CMDB设计
CMDB(配置管理数据库),用于存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相连,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性.在实际的项目中,CMDB常常被认为是构建其他ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。
首先在配置管理程序中定义了CMDB所包含范围。
所有配置项的信息都包括在配置管理数据库(CMDB)中,对所有IT组件、组件的不同版本和状态以及组件之间的相互关系进行跟踪。上海科技网CMDB包括数据中心IT设备和基础设施设备配置信息库(软件,硬件,运行信息配置);基础资源配置信息库(有源,无源网络,第三方资源配置信息);数据中心用户和用户资源使用数据库;数据中心产品的目录库;定义完成后,结合ITSM软件实施的需求,进行数据库设计,包括关键字段、关联性等等,完成相关表单设计后,对CMDB所涉及各类资源,做一次全面清查与统计,并录入响应表单.为ITSM系统上线做好准备。
7 服务流程的运行与优化
完成上述工作后,科技网ITIL管理体系已经基本确立,接下来的重点工作是在具体IT运维管理工作中贯彻标准,严格按服务流程运行业务,并记录运营数据,为流程合理性,有效性积累提供评判依据。
我们知道,ITIL服务体系建设与运营是个循序前进,不断优化的过程,而且随时业务模式,客户需求的不断变化,旧的流程会变更,淘汰,新的流程会不断产生,这就要求使用者通过PDCA循环方式,对服务流程进行不断的优化处理。
PDCA循环是世界公认的全面质量管理所应遵循的科学程序,按照Plan(计划)、Do(执行)、Check(检查)和Act(行动改进)的顺序进行质量管理,并且循环不止地进行下去。ITSM最佳实践按照PDCA循环顺序,不断地发现问题,解决问题,规范服务管理流程,不断优化运维管理活动,持续提高IT服务质量。
科技网在ITIL管理体系试运行期间,不断通过 PDCA循环方式,发现不足,改进优化流程。1年期间共整改不符合项13个,体系文件修改到V1.3版本,修改流程共20次,使程序管理始终处于符合实际需求,切合业务发展,稳定高效的环境下。
8 最后实施
经过前期准备工作,上海科技网实施ITSM的条件成熟了,公司于2015年9月与东华软件合作,通过FORCEVIEW V3平台正式实施ITSM项目。由于前期准备工作充分,项目进展非常顺利,系统平台已2016年2月上线,目前处于运营阶段,已将全部IT运维服务流程迁移上线,并取得良好的运行效果。通过本次ITSM的实践,再次证明,良好的前期准备工作,包括管理体系的建设,合理的流程,准确有效的CMDB建立等等,是ITSM成功部署的关键。
上海科技网将继续通过PDCA方式,利用ITSM先进管理手段,不断提高IT运维管理水平。
参考文献
[1]李静.ITSM实施不能一蹴而就[J].网络安全技术与应用,2009,(8):9.
[2]张春建.ITSM从何入手?[J].中国经济和信息化,2005,(8):42-43.
[3]朱琳.ITSM实施三招[J].中国经济和信息化,2004,(42):53.
(作者单位:上海交通大学)
关键词:ITSM;ITIL;前期工作;运行优化
1 现代企业面临的IT服务管理困境
随着企业规模发展与壮大,IT服务越来越受到重视,几乎所有企业发展到了一定规模,都会设立IT服务部门,但由于没有规范的流程作为指导,现阶段国内大部分企业的IT服务管理面临以下3个困境:
一是IT基础设施的可靠性,由于企业IT基础设施牵涉面广,涉及软硬件,系统,应用,数据库等各个层面.即使单个系统稳定性达到3西格玛水平(99.9%),IT服务整体故障时间依旧会达到年均10天以上,远远不能满足现代企业对IT系统稳定性的要求.二是企业IT部门处于被动运维角色,也就是被动应付故障发生,进行排障处理.而在平生缺乏主动性监管与风险控制;第三就是企业的IT管理过度依赖掌握核心技术资源的关键员工,缺少相应的流程和知识积累,一旦人员流动,IT服务质量会大幅下降。
解决上述IT管理困境,国际国内广大IT服务提供厂商,专业机构都在积极寻找综合解决方案,ITSM就是被实践证明行之有效的方法论。
2 ITSM与ITIL
ITSM称为”IT服务管理”,它是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的高质量方法。它结合了流程、人员和技术三大要素---标准流程负责监控IT服务的运行状况,人员素质关系到服务质量的高低,技术则保证服务的质量和效率。这三大关键性要素的整合使ITSM 成为企业IT管理人员管理企业IT系统的法宝和利器。
ITIL是IT服务管理领域的一个最佳实践框架,ITIL(IT Infrastructure Library)是CCTA(英国国家计算机和电信局)于20世纪80年代末开发的一套IT服务管理标准库,它把英国各个行业在IT管理方面的最佳实践归 纳起来变成规范,旨在提高IT资源的利用率和服务质量。目前已经成为业界通用的事实标准。它是一套协同流程(Process),并通过服务级别协议(SLA)来保证IT服务的质量。它融合了系统管理、网络管理、系统开发管理等管理活动和变更管理、资产管理、问题管理等许多流程的理论和实践。ITIL把IT管理活动归纳为一项管理功能和十个核心流程,主要为:服务台,事件 问题 配置 变更 发布 服务级别 可用性 连续性 能力 财务。
3 上海科技网IT运维管理需求
上海科技网是上海市独立的宽带城域网与IDC运营商,云计算服务提供商.公司目前经营着一张光缆总数超过2000km,节点遍及上海全市的宽带城域网,拥有两个总量超过3000个机柜的数据中心,同时大力发在大数据,云计算服务业务。不同形态的IT业务蓬勃发展.对IT运维工作提出了严峻的挑战。
公司业务的发展,需要全面提升IT运维服务管理水平。针对IT管理与客户需求,上海科技网提出IDC网络服务可靠性达到99.99%,基础电力服务可靠性达到99.999% 为达到这个指标,要求科技网有一套系统,高效,稳定的IT管理方法,基于这个认识,布置与实施ITSM管理平台,并通过平台运作来提高运维管理服务水平,最终提高客户对上海科技网IT运维服务满意度。成为公司上下的共识。
大量的研究和企业实践表明,在ITSM项目的生命周期中,大约80%的时间与前期准备,后期项目运营维护有关,而该阶段的投资仅占整个项目投资的20%,在经常出现的问题中,源自技术或产品方面的其实只占了20%,而流程失误方面的占40%,人员疏失方面的占40%。这就说明,决定IT服务质量的,更多的不是来自技术于软件平台,而是来自企业内部管理水平。一个组织表现出来的IT服务能力高低犹如冰山露出水面那一部分,但真正起到决定性作用的却是那水下的80%。对于IT服务组织来说,流程驱动和人员角色构成了拿水下的80%,技术使用则是那水面上表现出来20%,这就是ITSM领域的二八法则。我们可以得出以下结论:
(1)ITSM项目建设是不为仅仅上一套ITSM软件。
(2)流程的梳理、人员团队的管理、管理体制和规则的建设才是重中之重;
(3)技术服从于管理体系、服务于管理体系,技术的选择应与管理体系配套、保持一致。
所以我们看到,项目前期的IT运维体系建设,流程设计,CMDB建设,以及SLA服务保障协议的制定等具体工作才是真正的重点。而ITSM工具是为了正常有效运作这些流程的运作服务的。
有了上述认识,科技网在实施ITSM项目前,做了大量准备工作,具体工作如下:
4 确定管理目标落实ITIL管理理念
公司首先成立了,ITSM项目组,通过问卷调查,现场访谈,头脑风暴,专家讨论等等各种方式,结合上海科技网实际IT业务管理模式的梳理,公司发展规划,以及客户对科技网服务的需求,首先确定了上海科技网IT运维服务管理目标。
上海科技网IT运维管理目标:以规范、高效的方式进行IDC服务管理工作,持续改进服务管理质量,提高客户满意度,力求使上海科技网成为客户首选的IDC服务提供商,拟从以下方面利用管理系统进行整合,对公司的IT管理进行提升:
(1)建立规范的服务流程,提高IDC运行效率和质量;
(2)以客户为中心,提高IT服务质量和客户满意度;
(3)有效且高效地整合基础架构、信息、人员及IT资源;
(4)建立持续改进的服务管理机制,有效控制服务管理的全过程。
确立公司管理目标之后,上海科技网以ITIL理论为基础,结合实际IT服务管理活动,形成一套自上而下的统一的IT服务管理理念。一方面,使科技网服务管理活动更加规范且有理可依;另一方面,统一步调,使IT服务管理方面的制度决策能够得到良好的贯彻和执行。在建立ITIL理念的基础上,全面制定ITIL 标准的文件体系,并在IT管理中贯彻ITIL标准,则是ITSM具体实施准备工作的第一步。 5 ITIL V3标准的体系文件建立与SLA的制定
前文我们已经提到,ITIL的核心是协调流程,通过SLA来管理服务质量。部署ITSM,第一步工作是将公司IT管理纳入ITIL标准体系,首先在公司层面建立了
SLA:Service-Level Agreement,意思是服务等级协议。是关于网络服务供应商和客户间的一份合同,其中定义了服务类型、服务质量保障与未达到服务质量承诺时的赔付等等。SLA是ITIL 体系的两大核心之一,针对科技网业务特点以及对用户服务等级,科技网制定出针对一般用户的普通SLA,以及特殊需求用户的VIP SLA。主要包括以下几点
(1)基础网络可用率;
(2)基础电力可用率;
(3)环境温湿度报障;
(4)业务响应时间;
(5)故障恢复时限。
首先科技网针对普通用户,制订了SLA框架协议,承诺基本的服务质量保障,如基础网络可用率99.9%。基础电力可用率99.99%,故障恢复时间4h以内等等,这是框架SLA是科技网基本的服务承诺,附与每一个普通用户合同之后,与用户签订。
针对某些VIP客户对网络质量,基础设施,机房温湿度等具体条件的特殊保障要求,签订VIP业务 SLA,服务承诺与客户协商决定。
SLA 签订后,公司成立服务评审委员会,定期对SLA实行情况进行评审与改进。
6 CMDB设计
CMDB(配置管理数据库),用于存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相连,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性.在实际的项目中,CMDB常常被认为是构建其他ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。
首先在配置管理程序中定义了CMDB所包含范围。
所有配置项的信息都包括在配置管理数据库(CMDB)中,对所有IT组件、组件的不同版本和状态以及组件之间的相互关系进行跟踪。上海科技网CMDB包括数据中心IT设备和基础设施设备配置信息库(软件,硬件,运行信息配置);基础资源配置信息库(有源,无源网络,第三方资源配置信息);数据中心用户和用户资源使用数据库;数据中心产品的目录库;定义完成后,结合ITSM软件实施的需求,进行数据库设计,包括关键字段、关联性等等,完成相关表单设计后,对CMDB所涉及各类资源,做一次全面清查与统计,并录入响应表单.为ITSM系统上线做好准备。
7 服务流程的运行与优化
完成上述工作后,科技网ITIL管理体系已经基本确立,接下来的重点工作是在具体IT运维管理工作中贯彻标准,严格按服务流程运行业务,并记录运营数据,为流程合理性,有效性积累提供评判依据。
我们知道,ITIL服务体系建设与运营是个循序前进,不断优化的过程,而且随时业务模式,客户需求的不断变化,旧的流程会变更,淘汰,新的流程会不断产生,这就要求使用者通过PDCA循环方式,对服务流程进行不断的优化处理。
PDCA循环是世界公认的全面质量管理所应遵循的科学程序,按照Plan(计划)、Do(执行)、Check(检查)和Act(行动改进)的顺序进行质量管理,并且循环不止地进行下去。ITSM最佳实践按照PDCA循环顺序,不断地发现问题,解决问题,规范服务管理流程,不断优化运维管理活动,持续提高IT服务质量。
科技网在ITIL管理体系试运行期间,不断通过 PDCA循环方式,发现不足,改进优化流程。1年期间共整改不符合项13个,体系文件修改到V1.3版本,修改流程共20次,使程序管理始终处于符合实际需求,切合业务发展,稳定高效的环境下。
8 最后实施
经过前期准备工作,上海科技网实施ITSM的条件成熟了,公司于2015年9月与东华软件合作,通过FORCEVIEW V3平台正式实施ITSM项目。由于前期准备工作充分,项目进展非常顺利,系统平台已2016年2月上线,目前处于运营阶段,已将全部IT运维服务流程迁移上线,并取得良好的运行效果。通过本次ITSM的实践,再次证明,良好的前期准备工作,包括管理体系的建设,合理的流程,准确有效的CMDB建立等等,是ITSM成功部署的关键。
上海科技网将继续通过PDCA方式,利用ITSM先进管理手段,不断提高IT运维管理水平。
参考文献
[1]李静.ITSM实施不能一蹴而就[J].网络安全技术与应用,2009,(8):9.
[2]张春建.ITSM从何入手?[J].中国经济和信息化,2005,(8):42-43.
[3]朱琳.ITSM实施三招[J].中国经济和信息化,2004,(42):53.
(作者单位:上海交通大学)