数据中心一体化智能运维管理平台建设研究

来源 :科学与生活 | 被引量 : 0次 | 上传用户:ftlfh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:我国信息技术经过快速发展,在各行各业中有着重要应用。例如,大数据、云计算、区域链、人工智能和物联网等新技术在人们生产生活中的应用越来越广泛。这些新技术的应用极大地推动了社会发展,而在此过程中,数据中心是不可或缺的。因此,数据中心的数量越来越多,规模也越来越大。这就对数据中心的运营和机房基础设施的运维管理提出了更高的要求。因此,提高数据中心运营水平非常重要。基于此,本文对数据中心一体化智能运维管理平台的建设进行了研究。
  关键词:数据中心;一体化智能运维;管理平台
  引言
  中国信息技术的发展进入了“智能+”阶段。大数据、云计算、物联网、数据块链和人工智能等新技术在生活各个领域的应用离不开数据中心的支持。数据中心机房的数量和规模不断增加。总面积超过10万平方米、安装容量达数万台的机房非常普遍,这也给数据中心的运行以及计算机机房基础设施(包括电力、冷却、不间断电源、空调和安全系统)的运行和维护带来了困难。同时,云计算、人工智能、物联网、大数据等新技术在中国的应用趋于成熟,为实现智能数据中心运营和维护管理奠定了技术基础。
  1数据中心运维管理技术概述
  随着数据中心不断发展,其运维管理技术也在不断发展。通过研究,其发展可以分为三个阶段,分别是被动运维阶段、主动运维阶段和智慧运维阶段,具体分析如下:①被动运维阶段。在这一阶段,运维管理的流程还没有完全建立,相关技术手段还不成熟,主要通过人工现场巡检的方式对数据中心机房进行检查,通过手工对机房和设备的信息进行记录。②主动运维阶段。在这一阶段,相关工作人员针对供配电、制冷、不间断电源和空调等配备了遥测、遥控模块,建立了集中式远程监控平台以及事件、应急和变更等标准管理流程,使运维体系不断完善,运维管理水平不断提高,平台化、可视化和流程化的管理也得以实现。当前我国数据中心的运维管理基本上处于这一阶段。③智慧运维阶段。在这一阶段,物联网、大数据和智能技术等的应用实现了人、技术、流程和数据四要素的有机融合,此阶段的数据中心运维管理特点是自动化和智能化。
  2数据中心基本设备的运营管理
  数据中心基本设备(DCIM),一种国外开发的概念,但对dcim的概念存在不同的看法。他们有不同的机构和观点。但是,基本的总体思路是DCIM不是一种软件,而是一种管理模式和工具。根据IT的潜在作用,它可以将it设备与其他关键设备连接起来,为数据中心管理人员提供高效、高质量的运营服务。DCIM在总体框架的基础上,必须依靠一整套管理工具和平台,包括具体的软件、硬件设备、传感器设备等。以完成对数据中心联系系统的全面管理。此类管理侧重于站点的基本设备和IT基础设备,其主要目标和功能是科学合理地控制数据中心的成本、事件流程、模型预测、容量规划、集中监控、智能管理等,作为信息技术和设备管理的集成。
  3数据中心智能化运维管理的需求
  数据中心智能化运维管理应满足以下几方面需求。①可用性要求。在机房内应有备用电力、空调设施。当电力或者空调设施出现故障后,备用电力、空调设施会自动运行,保证机房能够保持正常运转。②安全性要求。在出现火灾等突发的安全事件后,系统可以对这些问题进行准确判断,并且能够自动报警,采取可以实行的应急措施,将安全问题造成的影响降到最低,保证机房运行安全。③经济性要求。企业经营的最终目的是营利。因此,保证机房运行的经济性能是非常重要的,这就需要降低能源的损耗,要求数据中心的智能运维管理系统能够根据环境温度对制冷机组的运行方式进行智能调节,根据热点区域对出风大小进行智能调节以及对照明系统进行智能调节,降低能耗。
  4数据中心运维管理智能化技术的实现途径
  4.1分析预测智能化
  所谓智能分析和预测,是指通过在服务器上基本应用SMATR信息和Syslog信息等各种类型的信息,IT部门需要在各种实例上做好监控和实践工作。在场景功能中,它可以使用LR或GBDT模型合理地预测服务器中常用组件故障的可能性和时间,并通过相应的措施防止故障,从而增强整体it体系结构。此外,对于产品和调整,可以通过预测标准容量来实现动态阈值、阈值趋势和瓶颈点的收集、分析和预测,并通过基于it系统容量预测的智能技术来实现模式开发。
  4.2机器学习建模与预测
  以“局部热点”事件为例,机器人通过学习建模,将引发机房内局部温度上升的火灾、空调系统和IT系统等相关要素特征化。基于这些信息,机器人可以判断各参数和温度上升之间的关系,并根据这些关系建立数学模型。在实际的运行过程中,若出现了上述热点事件,机器人将获取的各要素数据与历史数据进行比对,验证系统出现的问题,并对事件的起因进行分析,启动控制程序对事件进行控制。在整个控制过程中,机器人会对该热点事件进行持续性侦察,根据实时结果来决定下一步措施,直至热点事件消失。
  4.3一体化智能运维管理平台
  当前,大多数数据中心都采用了动态环境监测系统、集中it监测系统(网络管理系统)、服务管理系统和自动化操作工具等操作和维护管理系统,以帮助操作和维护人员实现标准化和高效的操作和维护管理。但是,这些运行和维护管理系统是由不同专业的运营和维护人员管理和使用的,这使得IT很难快速发现计算机机房环境或设备运行障碍所导致的IT系统故障。此外,每个系统的数据都是分布式的,使得很难实现每个系统运行状态的相关性分析和趋势预测。因此,建议在数据中心建立一个集成的智能操作和维护平台。该集成智能运行维护平台集成了数据中心相关监控、巡逻检测、服务管理、自动运行等系统,并利用人工智能等技术,实现运行维护管理系统的趋势分析、故障预警,甚至自动运行和控制功能。它收集与机房有关的集中监控系统、运行维护服务管理系统、检验系统和自动操作系统的信息,集中存储和处理,应用大数据技术进行分析和预先评估,并向每个系统发送控制指令或向运行维护人员发送警报信息。
  4.4智能机器人的应用
  数据中心的大部分运维工作都是重复性的,包括设备的定时开关机、系统日志的审查和审计以及数据的备份和恢复测试等。对于这些工作中的大部分工作内容,智能机器人都可以通过远程操作完成,这样不仅效率更高,还可以有效降低错误率,提高运维工作的质量。在大型数据中心机房的运维管理工作中,巡检的工作量比较大,比较容易出现漏检问题,而通过智能机器人巡检的方式代替人工巡检,可以有效解决这方面的问题。智能巡检机器人应用了很多先进技术,包括机器视觉、自动跟随、激光雷达导航、远红外热成像以及多传感融合等。基于这些先进技术,可以实现对数据机房内的设备和环境的不间断巡检,包括报警指示灯、温度、噪声、异味以及仪表读数等。一旦出现问题,工作人员可以迅速报警,从而实现故障的快速排除。
  结束语
  智能技术的发展给数据中心的运行和维护技术带来了新的活力。构建集成的智能运营和维护管理平台可以提高数据中心的可用性,降低运营成本,提高运营和维护效率,为新一代数据中心的智能运营奠定良好的基础。当前,智能运行和维护管理技术的应用仍处于探索的初级阶段,需要系统、全面、细致地分析实际情景和应用程序需求,不断论证和改进数据中心的智能升级和转换方案。人们认为人工智能、数据中心智能和无人技术等新技术将会在拐角处相等。
  参考文献
  [1]李俊林.浅谈数据中心设备及机房的智能化运维管理[J].数字通信世界,2020(02):284.
  [2]赵刚,杨大雷,朱献忠.设备远程智能运维平台架构设计探讨[J].宝钢技术,2019(06):27-30.
  [3]郝峻.數据中心基础设施智能运维探讨[J].电信技术,2019(11):51-55.
  [4]程少良.数据中心智能运维管理平台的建设研究[J].计算机产品与流通,2019(10):127.
  [5]李嗣喜.浅谈数据中心的人工智能管理与运维[J].计算机产品与流通,2019(01):123.
其他文献
目的 探讨负压封闭引流技术(VSD)在重度糖尿病足坏疽(DFG)治疗中的临床疗效及适应证.方法 随机选取60例符合Wagner分级3~5级的DFG患者,使用VSD技术治疗创面,即VSD治疗组,采用回顾性对照研究的方法,对1年前采用创面常规引流方法治疗DFG的患者62例进行对照分析,即常规治疗组,观察创面愈合时间、换药次数、转归(治愈率)、平均住院时间及住院总费用等.结果 VSD组与常规治疗组比较创
摘要:在经济一体化背景下,企业若想在激烈竞争中长久发展,势必要健全信息管理系统,为运营管理与决策提供充足的信息支持。但是,当前大部分企业信息管理意识淡薄,将重心放在业务拓展等与经济效益直接关联的项目中,相关制度不够完善,使得所采集的信息不够准确、真实,对统计工作质量产生直接影响。对此,企业应将大数据等先进信息技术引入其中,使统计信息管理更加完善、可靠,推动企业健康平稳发展。  关键词:网络化;统计
目的 探讨载药纳米活性炭在胃癌根治术中的淋巴示踪作用及指导淋巴结清扫的应用价值.方法 将63例进展期胃癌患者随机分为示踪组、对照组.示踪组术前胃镜下或术中肿瘤局部注射吸附5-FU的纳米活性炭(CNP-5-FU)混悬液,比较根治术中淋巴结清扫的数目、转移度、淋巴结的黑染及转移情况,观察不良反应.结果 示踪组平均清扫淋巴结(43.73±9.25)枚,明显高于对照组[(25.36±4.73)枚],差异有
目的 探讨多系统萎缩(MSA)患者在头部磁共振检查(MRI)的神经影像学特点,并与帕金森病(PD)进行比较.方法 对13例MSA-C型患者、12例MSA-P型患者和30例PD患者的常规MRI检查进行回顾性形态学测量分析.结果 MSA-C组桥脑断面面积及桥脑前后径大小明显低于PD组[桥脑断面面积:MSA-C组为(386.4±74.2)mm2,PD组为(528.5±40.8)mm2;桥脑前后径大小:M
近年来,随着人口老龄化、器官移植免疫抑制剂的使用,肿瘤放化疗,造血干细胞移植,超广谱抗生素和多种抗生素联合使用,皮质类固醇激素的应用以及各种导管介入治疗等,侵袭性真菌感染的发病率逐年上升,在入住ICU的重症患者以及低体重新生儿患者中,侵袭性念珠菌病尤其多见,其中又以侵袭性肺部真菌感染最常见,大约占50%~60%.更由于肺部真菌感染临床表现常无特异性,早期诊断困难,病情易被原发病掩盖,造成误诊、漏诊
目的 探讨糖尿病患者心踝血管指数( CAVI)与颈动脉硬化的相关性及其危险因素.方法 入选60例2型糖尿病患者以及同期入院治疗的60例非糖尿病患者,对受试者进行病史采集,检测血糖、血脂等生化指标,行颈动脉彩色多普勒超声检查及CAVI测定,分析CAVI与颈动脉硬化的相关性;以CAVI为因变量,年龄、血压、体质量指数、血脂、空腹血糖、糖化血红蛋白(HbAlc)等指标为自变量进行多元线性回归分析.结果
摘要:随着我国生产水平的不断发展和科技研究的不断深入,在智能化技术方面取得了较为显著的成绩,且在不断与一些机械控制、电气技术相结合实现更加高效精准的生产控制和管理。在电气自动化领域内融合智能技术可以较好地规避当前纯机械化管理和软件系统控制当中存在的设计缺陷问题,能够采用更加便捷和节约的方式快速进行分析后选择最优解,是一种在技术手段不断发展影响之下的必然趋势,也更有利于节约企业的生产建设成本,获得更
期刊
目的 分析吉兰-巴雷综合征的神经电生理与预后.方法 对38例吉兰-巴雷综合征患者的神经电生理与预后等临床资料进行回顾性分析.结果 电生理以轴索病变为主的吉兰-巴雷综合征,神经系统损伤症状重,预后差;急性炎症性脱髓鞘型不伴轴索损伤,预后相对较好.结论 电生理检查是吉兰-巴雷综合征临床诊断的重要方法,而动态检测可作为判断预后的客观依据,F波和复合肌肉动作电位是吉兰-巴雷综合征早期诊断的敏感指标。
目的 观察布地奈德混悬液联合硫酸沙丁胺醇溶液及氨溴索注射液雾化吸入治疗70岁以上慢性阻塞性肺疾病急性加重期(AECOPD)的临床疗效.方法 58例70岁以上AECOPD患者,在常规治疗的基础上加用布地奈德混悬液联合硫酸沙丁胺醇溶液及氨溴索注射液雾化吸入治疗;对照组56例AECOPD患者,给予常规低流量吸氧、抗感染、平喘化痰、加强营养支持等治疗;比较2组的临床效果.结果 治疗组总有效率为89.66%
目的 探讨新生儿化脓性脑膜炎患儿血清和脑脊液中C-反应蛋白(CRP)变化及其与病原菌的关系.方法 将2007年5月至2010年5月在我院收治的50例化脓性脑膜炎患儿分为革兰阳性(G+)组与革兰阴性(G-)组,选取同期非感染患儿21例作为对照组,采用快速免疫透射比浊法分别检测血清和脑脊液中CRP质量浓度;同时分别计算G+组与G-组脑脊液中CRP与血清CRP的比值.结果 G+组、G-组血清CRP质量浓