论文部分内容阅读
摘要:目前上海联通在上海各处有华为和中兴通讯等多家自建或代建的数据中心,每个数据中心都要配备独立专业的运维管理人员,而且各个数据中心的监管数据对上汇总也比较复杂,需一套统一的顶层数据中心DCIM平台来将各个数据中心的管理系统纳入到这个平台来进行统一的监管。
关键词:数据中心;运维管理;DCIM平台;管理系统;统一监管
1绪论
目前上海联通在上海的多个数据中心的管理平台中有多个厂家的管理系统,有中兴力维,艾默生等多个厂家的系统,管理水平参差不齐,没有一个统一的标准化的要求。有些机房甚至还是采用传统的人工的方式来日常维护,例如手动计算各种能耗分析,人工抄表式巡检,点数式资产盘点等。这些管理手段耗时耗力,准确度也很低。在联通总部也无法直接获取到一线数据中心的数据。随着上海联通业务的爆发式增长,也急需一套综合智能管理平台,在人手有限、满足基本需求前提下,提升运维和运营的质量。
这就需要一个“集中化、一体化、智能化”的垂直的顶层的DCIM管理平台。
2.总体方案设计
2 1设计原则。方案设计本着“实用、可靠、先进、安全、经济和共享”的建设原则,系统设计需满足以下原则:
1)整体性、便捷性
各智能化子系统统一界面、统一管理,在同一个界面上显示各子系统如动环、门禁、巡更、楼控、广播、信息发布等设备的状态,并可实现一体化操作,无需多平台跳转。
2)安全性
建立用户安全机制,多用户权限及强制密码修改功能
重要设备如动环监控单元采用双电源冗余,统一管理平台服务采用双机备份,重要监控点位采集设备冗余备份
3)开放性、扩展性
系统不仅可以向下集成各种软硬件接口,还可对外提供各种接口,完全实现与其他平台的无缝对接
随着用户业务的拓展,系统能方便的实现扩充与扩容,避免因扩充而需要更换中心设备或系统软件等
4)稳定性、可靠性
系统采用分层化、模块化的设计,保证各智能化系统在扩容、升级时不影响其他系统,整体综合平台可无间断安全运行。
5)节能、经济性
统一管理平台的设计是对各子系统管理平台的优化及集成,各类监测数据统一管理,避免各子系统管理平台的重复建设,优化管理入口及呈现界面,提升管理人员管理效率,节约人力成本。
2.2系统架构
顶层DCIM管理平台平台建设需打破传统运维各子系统独立分散的垂直管理,将采用“集中化、一体化、智能化”的设计模式,实现主动、高效、流程化的运维管理。平台架构采用分层设计,实现功能总集成、流程总调度、资源全监控。
3软件架构
3.1呈现层。提供多种用户交互方式。
组态通过图形化界面分多个层次展现园区全景,包括园区组态、楼栋组态、楼层组态、机房组态和设备组态,组态界面可以通过控件进行任意的组合配置,按照用户的要求形成实景或抽象的管理界面。
3.2业务层。业务层包括三个方面:统一管理功能,运维功能和管理功能。
3.3采集层。采集层有三类数据来源:
已有DCIM平台的从平台统一采集;
没有平台的各子系统单独对接采集;
与联通自有业务系统的对接;
4管理平台功能
4.1事件流管理。以客户服务为中心,个人工作台作为运维人员的主要工作界面,包含关键参数展示及运维工作任务事项。
4.1.1关键参数显示
关键参数指标包括:能耗数据、资产信息、容量信息;
关键参数指标的展示包括曲线图、柱状图、趋势图等图形化展示;
容量趋势图支持按年、月、日展示空间、电力、制冷容量信息。
4.1.2任务显示
任务显示模块有待办任务、已办任务和我创建的任务,包括任务名称、任务类型、任务日期、级别、发派人等信息,根据任务级别可以区分任务的优先级,主要级别有:紧急、重要、标准、次要;
已办任务和我创建任务支持任务详情查看功能和按照任务处理状态进行查询功能;
我创建的任务支持告警或资产工单创建菜单,根据工单类型跳转至对应的工单创建页面;
待办任务支持任务快速处理菜单,根据任务类型跳转到详细的任务处理页面,在任务处理页面可以查看任务详细信息、任务指派人信息、任务处理意见等信息。
4.2告警统一管理。系统告警分为四级:一级告警、二级告警、三级告警和四级告警(重要程度从高到低),其中,一级告警以红色标识,二级告警以橙色标识,三级告警以黄色标识,四级告警以淡蓝色标识,告警级别、告警上下限值可根据需要更改。
4.3机房环境管理。机房环境管理提供对机房、机架、机位的温湿度数据的分析、呈现、和告警等管理功能。动环数据综合分析
动环数据综合分析需要保证动环等系统的接口提供相应数据(UPS监控、精密空调监控、配电柜监控、漏水监控、电池组监控、柴发监控、消防监控、冷冻机监控、冷却塔监控、门禁卡监控等)。
4.4制冷、配电展示。集中监控系统支持按照空间维度(基地-楼宇-模块-机房-冷通道-机列-机柜)进行制冷、配电等的展示。同时集中监控系统把制冷、电力等信息同步给资源管理系统,资源管理系统可实现对制冷、电力等容量信息进行查询统计、容量报表、低容量告警和容量配置等功能。
4.5联动管理。1、系统支持自动保存所有的动环、门禁和视频之间的联动记录,保存的内容包括联动的触发事件信息(如××监控量告警/消除、时间)和联动的结果(如联动XX摄像头录像、转到预置位或触发××遥控量)。
2.可单独查询联动日志,可按任意时间、触发条件(单选)和联动结果(单选)组合查询。
3.可以查询联动异常情况,如触发事件和联动结果对应的对象已经删除等情况。可根据联动异常情况批量删除联动规则。
4.63D视图。系统支持机房仿真3D呈现。查询定位设备设施。支持3D方式呈现机柜容量信息。支持查看机房温度分布云图,提供颜色一温度刻度尺。支持历史温度云图播放,鹰眼视图、3D视角切换、收藏、定位,自动巡检等功能。
4.7问题管理。问题可以提供界面手动录入问题信息,提供统计、查询和导出功能。
4.8容量管理。系统具备结合资产管理对空间、电力等容量信息进行查询统计、容量报表、低容量告警和容量配置等功能。结合资产管理对空间、电力容量,冷量。可输出容量报表、高容量告警、容量配置。
4.9资产管理。按照区域、机房、楼层、房间展示资产列表,根据资产维护日期和维护人自动发出设备维护提醒通知,维护人员可填写维护信息,导出维护记录
5某电信公司案例
一个电信公司的频统计可能有100万个组合条件。包括:站点,设备类型,监控量类型,告警级别,告警时间段,告警次数,搜索时间范围。
某电信公司A 2013年~2016年,3年历史数据合计27亿条,高速查询对比。
某电信公司B 2010-16年,5年历史数据:50亿条,3万种报警类型400万条左右的报警数据。
由于自有的一些业务系统已经比较成熟,将其融合到总格管理平台内能发挥更大的效益。同样,自由业务系统需要定制对外接口,即可完成两平台的对接。
结语
在IDC领域,高速发展的IDC数据中心,也就意味着数据中心管理系統需要提升一个层次。大数据爆发的时代背景下,传统的数据中心管理系统,只能完成了第一层响应响应型分析,即收集数据,报表统计,高速查阅;而目前设计的数据平台,可完成第二层诊断型分析和趋势分析;第三层预测性分析和预测模型的建立;以及第四层认知转换这四个更高层级的分析。
后期的发展可以由联通来提出业务模式、业务流程、业务时间轴,由供应商根据实际需求来搭建数据模型,使得采集的庞大数据依附在模型里面发挥更加实际更加智能化的效果。
关键词:数据中心;运维管理;DCIM平台;管理系统;统一监管
1绪论
目前上海联通在上海的多个数据中心的管理平台中有多个厂家的管理系统,有中兴力维,艾默生等多个厂家的系统,管理水平参差不齐,没有一个统一的标准化的要求。有些机房甚至还是采用传统的人工的方式来日常维护,例如手动计算各种能耗分析,人工抄表式巡检,点数式资产盘点等。这些管理手段耗时耗力,准确度也很低。在联通总部也无法直接获取到一线数据中心的数据。随着上海联通业务的爆发式增长,也急需一套综合智能管理平台,在人手有限、满足基本需求前提下,提升运维和运营的质量。
这就需要一个“集中化、一体化、智能化”的垂直的顶层的DCIM管理平台。
2.总体方案设计
2 1设计原则。方案设计本着“实用、可靠、先进、安全、经济和共享”的建设原则,系统设计需满足以下原则:
1)整体性、便捷性
各智能化子系统统一界面、统一管理,在同一个界面上显示各子系统如动环、门禁、巡更、楼控、广播、信息发布等设备的状态,并可实现一体化操作,无需多平台跳转。
2)安全性
建立用户安全机制,多用户权限及强制密码修改功能
重要设备如动环监控单元采用双电源冗余,统一管理平台服务采用双机备份,重要监控点位采集设备冗余备份
3)开放性、扩展性
系统不仅可以向下集成各种软硬件接口,还可对外提供各种接口,完全实现与其他平台的无缝对接
随着用户业务的拓展,系统能方便的实现扩充与扩容,避免因扩充而需要更换中心设备或系统软件等
4)稳定性、可靠性
系统采用分层化、模块化的设计,保证各智能化系统在扩容、升级时不影响其他系统,整体综合平台可无间断安全运行。
5)节能、经济性
统一管理平台的设计是对各子系统管理平台的优化及集成,各类监测数据统一管理,避免各子系统管理平台的重复建设,优化管理入口及呈现界面,提升管理人员管理效率,节约人力成本。
2.2系统架构
顶层DCIM管理平台平台建设需打破传统运维各子系统独立分散的垂直管理,将采用“集中化、一体化、智能化”的设计模式,实现主动、高效、流程化的运维管理。平台架构采用分层设计,实现功能总集成、流程总调度、资源全监控。
3软件架构
3.1呈现层。提供多种用户交互方式。
组态通过图形化界面分多个层次展现园区全景,包括园区组态、楼栋组态、楼层组态、机房组态和设备组态,组态界面可以通过控件进行任意的组合配置,按照用户的要求形成实景或抽象的管理界面。
3.2业务层。业务层包括三个方面:统一管理功能,运维功能和管理功能。
3.3采集层。采集层有三类数据来源:
已有DCIM平台的从平台统一采集;
没有平台的各子系统单独对接采集;
与联通自有业务系统的对接;
4管理平台功能
4.1事件流管理。以客户服务为中心,个人工作台作为运维人员的主要工作界面,包含关键参数展示及运维工作任务事项。
4.1.1关键参数显示
关键参数指标包括:能耗数据、资产信息、容量信息;
关键参数指标的展示包括曲线图、柱状图、趋势图等图形化展示;
容量趋势图支持按年、月、日展示空间、电力、制冷容量信息。
4.1.2任务显示
任务显示模块有待办任务、已办任务和我创建的任务,包括任务名称、任务类型、任务日期、级别、发派人等信息,根据任务级别可以区分任务的优先级,主要级别有:紧急、重要、标准、次要;
已办任务和我创建任务支持任务详情查看功能和按照任务处理状态进行查询功能;
我创建的任务支持告警或资产工单创建菜单,根据工单类型跳转至对应的工单创建页面;
待办任务支持任务快速处理菜单,根据任务类型跳转到详细的任务处理页面,在任务处理页面可以查看任务详细信息、任务指派人信息、任务处理意见等信息。
4.2告警统一管理。系统告警分为四级:一级告警、二级告警、三级告警和四级告警(重要程度从高到低),其中,一级告警以红色标识,二级告警以橙色标识,三级告警以黄色标识,四级告警以淡蓝色标识,告警级别、告警上下限值可根据需要更改。
4.3机房环境管理。机房环境管理提供对机房、机架、机位的温湿度数据的分析、呈现、和告警等管理功能。动环数据综合分析
动环数据综合分析需要保证动环等系统的接口提供相应数据(UPS监控、精密空调监控、配电柜监控、漏水监控、电池组监控、柴发监控、消防监控、冷冻机监控、冷却塔监控、门禁卡监控等)。
4.4制冷、配电展示。集中监控系统支持按照空间维度(基地-楼宇-模块-机房-冷通道-机列-机柜)进行制冷、配电等的展示。同时集中监控系统把制冷、电力等信息同步给资源管理系统,资源管理系统可实现对制冷、电力等容量信息进行查询统计、容量报表、低容量告警和容量配置等功能。
4.5联动管理。1、系统支持自动保存所有的动环、门禁和视频之间的联动记录,保存的内容包括联动的触发事件信息(如××监控量告警/消除、时间)和联动的结果(如联动XX摄像头录像、转到预置位或触发××遥控量)。
2.可单独查询联动日志,可按任意时间、触发条件(单选)和联动结果(单选)组合查询。
3.可以查询联动异常情况,如触发事件和联动结果对应的对象已经删除等情况。可根据联动异常情况批量删除联动规则。
4.63D视图。系统支持机房仿真3D呈现。查询定位设备设施。支持3D方式呈现机柜容量信息。支持查看机房温度分布云图,提供颜色一温度刻度尺。支持历史温度云图播放,鹰眼视图、3D视角切换、收藏、定位,自动巡检等功能。
4.7问题管理。问题可以提供界面手动录入问题信息,提供统计、查询和导出功能。
4.8容量管理。系统具备结合资产管理对空间、电力等容量信息进行查询统计、容量报表、低容量告警和容量配置等功能。结合资产管理对空间、电力容量,冷量。可输出容量报表、高容量告警、容量配置。
4.9资产管理。按照区域、机房、楼层、房间展示资产列表,根据资产维护日期和维护人自动发出设备维护提醒通知,维护人员可填写维护信息,导出维护记录
5某电信公司案例
一个电信公司的频统计可能有100万个组合条件。包括:站点,设备类型,监控量类型,告警级别,告警时间段,告警次数,搜索时间范围。
某电信公司A 2013年~2016年,3年历史数据合计27亿条,高速查询对比。
某电信公司B 2010-16年,5年历史数据:50亿条,3万种报警类型400万条左右的报警数据。
由于自有的一些业务系统已经比较成熟,将其融合到总格管理平台内能发挥更大的效益。同样,自由业务系统需要定制对外接口,即可完成两平台的对接。
结语
在IDC领域,高速发展的IDC数据中心,也就意味着数据中心管理系統需要提升一个层次。大数据爆发的时代背景下,传统的数据中心管理系统,只能完成了第一层响应响应型分析,即收集数据,报表统计,高速查阅;而目前设计的数据平台,可完成第二层诊断型分析和趋势分析;第三层预测性分析和预测模型的建立;以及第四层认知转换这四个更高层级的分析。
后期的发展可以由联通来提出业务模式、业务流程、业务时间轴,由供应商根据实际需求来搭建数据模型,使得采集的庞大数据依附在模型里面发挥更加实际更加智能化的效果。