资源管理系统应用优化方案

来源 :科学与财富 | 被引量 : 0次 | 上传用户:sil87sil
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文结合实际工程,详细介绍了C/S架构的系统使用群集负载机制存在性能问题时,可以采取的解决方案即F5负载均衡在实际工程中的应用。
  关键词:C/S架构; 群集; F5负载均衡
  一. F5负载均衡
  负载均衡,英文名称为Load Balance,其意思就是将负载(工作任务)进行平衡、分摊到多个操作单元上进行执行,例如Web服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等,从而共同完成工作任务。当某台SERVER设备发生故障,F5 将自动发现并不再把流量发送到这台故障的SERVER上,从而实现SERVER的高可用。
  二.优化测试与方案实施中发现与解决的问题
  第一阶段: 调整Weblogic配置参数
  资源管理系统出现异常时最大的特点为:单个SERVER异常时,影响其它SERVER上的在用用户与用户的登录操作。在前期过程中,一直致力于单SERVER的参数的调整与优化,以避免单个SERVER的异常,其中包括 -Xmx2048m(最大堆内存)、-Xp8196K(堆碎片)、-Xloratio0.3 (大对象区比率),经反复的调整优化测试,相应的参数能够使系统相对平稳安全运行,但因大业务使用的需求,系统异常情况并未得到有效解决。因此又对针对Weblogic的Cluster集群机制进行了研究。
  根据已有的资源系统C/S架构,客户端使用T3协议访问服务器上部署的应用,Cluster群集机制在8.1版本的使用上,存在性能问题,当群集中任何一个SERVER出现异常时,会导致整个系统运行缓慢。
  为此,我们在测试环境进行了大量的测试,针对现有的资源管理系统客户端配置多个T3地址串的情况,测试发现异常SERVER及配置T3地址数量对用户登录耗时影响很大。以下是测试数据:
  1.测试环境现状介绍:
  测试环境为集群环境,两台主机,IP地址以192.168.1.1和192.168.1.2为例,每台主机部署3个应用服务,每个应用服务有自己的端口号
  客户端单个T3地址样例:t3:// 192.168.1.1:9931
  客户端T3地址串样例:t3:// 192.168.1.1:9931, 192.168.1.1:9932, 192.168.1.2:9922
  2.测试用例
  测试情况用例
  2.1所有SERVER均正常,测试资源客户端配置SERVER由少到多对登录的影响
  配1个T3地址 时间: 4s 5s 6s
  配2个T3地址 时间:10s 9s 7s
  配6个T3地址 時间:20s 15s 22s
  以上数据,除去网络环境等因素影响,证明客户端配置SERVER的数量,会影响用户的登录时长。客户端配的T3地址串中SERVER数量越多,客户端登录越耗时。
  2.2测试资源客户端配T3地址串中有shutdown状态的SERVER对登录影响
  配2个T3地址1开1停 时间 :12s
  配3个T3地址2开1停 时间:9s 18s 14s 14s
  配4个T3地址2开2停 时间:28s 28s 60s
  配6个T3地址2开4停 时间:55s 52s
  除去网络环境因素影响,多SERVER配置中,状态异常的SERVER或者繁忙的SERVER越多,登录耗时越长。也证明了客户端配置T3地址串后,会以某种机制询访T3串中的每个服务地址,异常SERVER对询访影响很大,但它位于T3串的前后位置对耗时几乎无任何影响。
  针对上述的问题及规律,又进行了客户端询访机制的优化,客户端有一个参数控制程序对SERVER的询访时间:weblogic.jndi.requestTimeout ,默认时间为5s,这个时间压缩到1s。经测试该参数调整对上述两种场景的登录耗时有优化作用。
  第二阶段:实现对F5负载均衡的支持
  在经测试确定客户端进行随机分配并进入指定的SERVER的方案不可靠之后,经与F5设备厂家、Weblogic厂家多次沟通与测试,采用F5实现负载均衡的方案,实现基于T3协议的客户端与集群服务器之间的负载均衡。
  首先通过现场研发8.1版本的Weblogic补丁,解除了F5负载均衡要求应用服务器上应用服务端口号和F5端口号一致的限制,在 F5侧配置客户端访问的T3协议地址,并建立该地址与资源12个SERVER服务间的映射关系。在功能上实现了现有环境对F5负载均衡的支持。
  测试中发现,F5能将用户请求的数据流随机分配到某个SERVER上,通过该设备的这种机制实现了系统负载的均衡,在使用中,由于对Weblogic SERVER状态判断上有缺陷:只能发现SERVER宕掉,不能发现SERVER无响应,有时SERVER依然是Running状态,但是用户已经反映系统慢了,在这种情况下,系统整体性能会一直受影响。
  第三阶段:实现了对Weblogic SERVER各种异常的发现
  F5在运行过程中,需要轮询已在设备上配置的SERVER列表,有问题的SERVER会被踢出,再进行用户请求数据的分配时,只按踢出后的SERVER列表进行随机分配,实现系统的稳定安全运行,保证用户系统操作的有效性。
  通过修改F5健康检查机制,同时能发现Weblogic SERVER宕掉和系统无响应两种情况。但是在Weblogic SERVER无响应的情况下,F5健康检查机制的发现时间较长,加上踢出SERVER列表中有问题的SERVER,时间在5分钟以上,这期间整个系统性能受影响,影响用户的使用。
  第四阶段:把系统性能受影响时间控制在1分钟以内
  优化F5对Weblogic SERVER的健康检查脚本,缩短F5设备对列表中异常SERVER的监控与处理时间。号线系统厂家针对异常SERVER的监控新开发了一个JSP页面,在F5上配置对该页面的调用,发现3次调用无响应,视为异常SERVER,F5设备会直接将其从列表踢除,这样实现了从发现到处置Weblogic SERVER异常的时间在1分钟以内。
  第五阶段:应用程序端及其它方面进行的调整优化
  分析以前系统异常情况,多是因内存溢出(OOM)或者大对象区空间不足GC忙于回收。号线系统厂家在尽可能不影响用户使用情况下,对此进行了代码层面与数据库查询SQL方面的优化,减少频发的大对象。
  开发用于监控各SERVER状态的JSP页面,在主机上配置TIMER,通访问调用此页面,发现异常SERVER,先执行kill -3 生成便于日后分析的Heapdump、Javacore文件,之后执行kill -9 杀掉异常SERVER,根据Weblogic配置的Auto Restart 功能参数将异常SERVER进行重起,保证不影响系统性能,实现无人值守时,仍能处置异常。同时该JSP页面也被使用在F5的监控中调用中。
  配置第三方监控软件,对发现异常SERVER,新增javacore 、heapdump文件发送告知短信给相关负责人与维护人员,第一时间发现问题并处理。
  结论
  任何类型的系统故障都可能意味着收入、信誉和客户满意的巨大损失。资源管理系统使用F5负载均衡,系统宕机和系统慢问题得到了很好地解决。该问题的解决对改进用户满意度、降低反应性IT支持成本、提高 IT 生产力有着至关重要的作用。
其他文献
摘 要:“原子视界”以网络社区为生产组织形式、以设置生产接触点为根本要素、以打造一个在线打底服装产销一体化平台为实现形式。其核心是基于开源分享模式的生产组织形式重组,旨在解决传统产销模式中,企业与个人二元对立的难题,从而实现“生产大众化”、“体验高质量化”、“运营模式高效化”。  关键词:原子视界;商业模式;大众化  一、前言  当下电子商务层出不穷,以网络虚拟平台为载体的贸易形式日益的发展,同时
期刊
摘 要:随着国际社会对于石油工程信息化建设的进一步提升,使得国外的石油工程建设和施工都一直能够处于领先的水平,对于中国来说,在硬件设施和人才培养都在不断发展的现在,对于石油工程信息化的重视也应该要不断的得到强化。本文从石油工程信息化建设的现状出发,阐述了石油工程信息化存在的意义,以及有针对性的提出了在今后的发展中,应该如何应对石油工程信息化的进一步发展趋势。  关键词:石油工程; 信息化; 发展 
期刊
摘 要:曾国藩高超的人才管理术体现在选才、用才和驭才三个方面。曾国藩选才,以少言务实、德才兼备、志趣高雅、朴实廉洁为标准。曾国藩用人,用人所长、量才使用、奖罚分明。曾国藩驭才,既重制度约束、也重情感俘获。  关键词:曾国藩,选才,用才,驭才  曾国藩是晚清著名的政治家、军事家和文学家,他以文官出仕,以武功致显。1853年,曾国藩为了镇压太平天国,开建幕府。曾国藩幕府人才济济,有善于谋划的军事家、有
期刊
摘 要:随着季节的变化,道路桥梁施工往往受到温度的影响而阻碍了施工的进展,而混凝土在道路桥梁施工中是运用最多的材料,其浇注质量的高低直接影响了道路的使用性能。因此,在道路桥梁施工中,尤其是冬季阶段更需要保证浇注质量。针对这一点,文章重点分析了道路桥梁冬季施工中混凝土浇筑的施工措施。  关键词:道路桥梁;混凝土浇筑;冬季施工  从建筑学角度分析,道路桥梁施工常会受到外界因素的影响而改变操作计划。通常
期刊
摘 要:介绍了电除尘器电源装置新技术在某火电厂的应用;对电源装置的原理、组成与特点及其控制方式、相关参数设置进行了较详细的说明,最后给出了电除尘器电源装置新技术应用的效果。  关键词:电源装置应用 原理及特点 控制方式 效果  0 引言  某火力发电企业#3、#4机组的容量为600MW,每台锅炉配置了兰州除尘设备厂生产的双室五电场静电除尘器,每台炉共有20个电场;电除尘出口粉尘浓度一般在40~50
期刊
摘 要:随着科技的发展,智能化在各个领域也得到了较为广泛的应用,不仅有效提高了效率和降低了成本,为促进社会的科技进步提供了保障。一些高新技术进入了工程机械的生产,工程机械产业出现了智能化发展的趋势。工程机械的智能化极大地提高了工人生产的效率和安全性可靠性。  1、工程机械智能化的必然性  1.1 国际前沿工程机械发展趋势。  一直以来,国际市场上工程机械技术产品由美国、日本、西欧、俄罗斯等国际大型
期刊
摘 要:恒定速度是CRH5型列车最为重要的功能之一,确保车组能够维持到一个恒定的速度上,从而保障动车组安全性与可靠性。近几年来,随着科学及时的发展,动车组基本应用八辆编组方式进行设计,而将速度传感器设置在动车组中可以为车组设置单独的速度系统,进而保证保证动车组运行稳定。但由于动车组在运行中容易出现各种故障,导致动车组运行受到影响。为避免动车组中速度系统缺陷,需要相关人员深入分析动车组运行情况,并针
期刊
摘 要:随着近年来林业的不断发展,森林资源已经逐渐得到了更多的保护。然而,目前林下的可燃物的不断增加,加剧了森林火险的发生。森林火险是一项危害性大且突发性较强的自然灾害,对人们的生命安全和财产损失造成了严重的损害。文章针对森林防火中的问题进行分析,进而提出了相应的解决对策。  关键词:林业森林防火;问题;解决措施  在林业的建设过程中,森林火险是危害森林安全的一个重要因素。森林火灾能够在短时间内将
期刊
摘 要:跑道侵入人为风险分析是跑道安全研究的重要组成部分,根据SHELL模型将跑道侵入人为风险分为人、机、环、管四类。提出一种基于本体的跑道侵入人为风险分析方法,利用Protégé本体编辑工具,实现跑道侵入人为风险的推理、可视化等功能。  关键词:跑道侵入;人为风险;本体;Protégé  引言  跑道侵人是一种严重影响机场安全,容易导致灾难性碰撞和人员伤亡事故的不安全事件类型。作为跑道安全的重要
期刊
摘 要:随着市场经济的不断发展与社会竞争的日益激烈,中职院校学生的培养越来越具有挑战性。如何培养职业技术应用型人才,不断满足社会及企业对职业技术队伍的数量和质量需求已经成为影响中职院校教育发展命运的大课题。因此,中等职业院校的教育改革势在必行。本文就中职院校教育改革问题重点从教学模式、教学方法、教学师资三个方面的改革进行分析讨论。  关键词:中职教育;教育改革  1 改革的必要性  从十七大报告中
期刊