探究服务器在线模式下硬件故障诊断的方法

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:dorisnanjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]随着信息技术在当前社会越来越受到重视,服务器的价值也更加突显出来。作为第二代UNIX的操作系统,AIX系统所具有的快速、稳定、安全等优势也更加为人们所重视,逐渐成为银行、数据中心等关键企业中发挥中枢作用的操作品台。但是,在服务器在线模式中,AIX系统仍然会存在一些错误。基于此,本文拟以服务器在线模式下硬件故障诊断为研究主题,希望能够为服务器的高效稳定工作提供保障方案。
  [关键词]服务器;在线模式;硬件故障;诊断
  中图分类号:TP368.5 文献标识码:A 文章编号:1009-914X(2017)36-0236-01
  前言:云技术及服务器发展状况概述
  自从计算机诞生以来,辅助计算机而出现的服务器及其相关的各种技术已经有了几十年的历史。就目前来看,随着互联网通信行业的迅猛发展,新的技术标准和需求已经向着云技术和移动平台的方向发展,这样能够最大限度地满足便捷、快速的需要,并且,客户端也向着手持化的方向推进,这也要求客户端使用程序需要保存在依托互联网而存在的云端之中。
  按照上述的发展路径,今后的承载云技术和移动终端的服务器数量,势必会因为需求量的增长而呈现几何数的增加状态,如此,在便利大众生活的同时,其中的问题和故障也会因为数量的激增而暴露出来。但是,一旦落实到故障诊断问题中,由于服务器的网络化连接,及同时支持大量操作者,故障检测和排查就变得异常复杂,给服务器的检测维修带来了很大的麻烦。
  为了避免上述状况给服务器检修造成的不便,需要开发更为专业的操作系统以开展工作。本文展开讨论的平台是AIX(Advanced Interactive eXecutive)操作系统,它是IBM公司根据AT&T Unix System V而研发出的类似UNIX的操作系统,可以说是更先进的第二代UNIX,具有性能完善,使用方便,扩充性强等主要优势。下面本文便结合实例,探讨服务器在线模式下硬件故障诊断的方法。
  1.服务器在线模式下的一般故障
  电脑服务器在使用中常会出现一些一般性的错误,虽然这些错误并不至于导致整个网络系统的崩溃,但是会限制系统的正常工作,降低数据处理和运算的效率,如果不及时处理,有可能进一步扩大,对系统安全造成破坏。
  所以,一旦服务器系统出现问题时,工作人员要及时发现并且着手处理,以避免进一步破坏的发生。因此,服务器的管理人员要具备一般故障的预先判别经验,做到早发现、早排查,这时故障诊断的重点和关键。
  2.系统故障分析和判断方法概述
  在AIX系统下,为了更快速地检测出故障所在,可以使用diag命令的方式进行处理,具体来说,工作人员首先进入系统的管理员模式,运行#diag命令,以开始服务器硬件的诊断,这样可以完成服务器主机内部存在问题的排查和分析,主要包括:
  diagnostic routines
  advanced diagnostics routines
  task selection (Diagnostics, Advanced Diagnostics, Service Aids, etc)
  Resource Selection
  这其中,#diag -S testsuite表示进行测试的特定设备“测试组”,包含以下八种:
  (1)基本系统;(2)I/O 设备;(3)异步设备;(4)圖形设备;(5)SCSI设备;(6)存储设备;(7)通信设备;(8)多媒体设备
  #diag –s
  在所有资源上运行诊断。
  3.查看系统的错误日志
  服务器系统的错误会给我们预测以后的错误提供经验和参照,所以查看系统的错误日志也是很重要的一项任务。
  具体来说,在服务器运行中,系统出现错误时,错误一般会被记录在errlog中,以文件的形式保存下来,其中一些错误还会直接显示在系统的终端中。当工作人员检查系统错误的日志时,可以使用下列命令:
  #errpt|more 查看系统所有的记录
  IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTION
  E85C5C4C 0426104399 P S CFGLFT SOFTWARE PROGRAM ERROR
  2BFA76F6 0426104099 T S SYSPROC SYSTEM SHUTDOWN BY USER
  9D4CF6E7 0426104399 T O errdemon ERROR LOGGING TURNED ON
  1E2AC07E 0426103999 T O errdemon ERROR LOGGING TURNED OFF
  1E5EER4T 0423132999 T O clstrmgr OPERATOR NOTIFICATION
  在这其中,IDENTIFIER表示的是错误的编号,这些信息在一般情况下不会被使用到,但是如果检查时需要更为详细的信息时,才会使用这些信息。
  而TIME STAMP表示的是错误的具体时间,当错误出现时,便被记录下来,其格式往往是以月-日-时-分-年的形式展现出来。此外,命令中的T指的是Type ,表示服务器的错误类型,这其中P表示的是永久性的错误,当看到此类时需要提高警惕;而T表示的是临时性的错误。
  C表示的是为Class, 其记录的是错误的具体种类,如:H : Hardware S : Software O : Errloger command messages U : undetermined 。
  此外RESOURCE_NAME表示的是错误的来源,而DESCRIPTION表示的是错误的描述。工作人员可以通过这些具体的命令及其结果来推知错误的具体情况和所在之处,尽快地完成服务器系统的排查和维修工作。
  4.DUMP文件及其使用
  DUMP文件指的是,当服务器系统出现软件或者硬件的故障而造成宕机情况时,系统将会自动手机故障出现时的系统内存、处理器等状态信息,并储存到文件中,并将在终端的屏幕上显示888开始的代码。借助DUMP文件,有助于工作人员具体分析故障发生的原因,从而找到症结。
  5.日常檢查服务器状态的项目及其相关命令
  作为次要的常规操作,进行定期的服务器系统性能的检查,对于工作人员了解服务器的运行状况及故障点的预测。进行该操作的相关命令包括:
  Iostat:Iostat命令可以帮助工作人员了解服务器系统的I/O 状态,并且分析处理器中各个端口的服务占比情况等。
  Vmstat:Vmstat命令可以帮助工作人员检查系统的虚拟内存的状态和运行情况。
  Sar:Sar命令可以用来检查服务器系统的活动状态。
  Topas:Topas命令可以帮助工作人员实时地进行系统内存的监控工作,以及处理器、I/O 端口以及swap储存空间的基本情况。
  Svmon:该命令用来查看系统当前的内存的具体使用情况。
  6.结语和展望
  总之,任何服务器系统都存在出现故障的可能性,这是科技手段终究无法避免的终极情况。对此,我们要积极行动起来,充分发挥AIX系统的优势,进行系统运行状况的实时监控和检测,以最快速度的完成故障的诊断和排查工作,避免更大的故障出现。我们也应该相信,随着电子计算机技术的不断发展,服务器系统的故障排查,终究会实现自动化的趋势。
  参考文献
  [1] 高峰,覃冬梅,茹锋,等.基于客户机/服务器模式下的热电厂在线数据采集的编程实现[J].工业控制计算机,2000(4):33-35.
其他文献
[摘 要]在电子信息技术飞速发展的现在,电力行业的自动化水平不断提高,加强输配电及其用电工程的自动化运行,是电力系统发展的主要方向。本文结合电力输配电及用电工程的现状的发展现状,对输配电及用电工程的自动化运行进行了研究和探讨。  [关键词]输配电 用电工程 自动化 运行  中图分类号:TH303 文献标识码:A 文章编号:1009-914X(2017)36-0225-01  1 引言  在当前的经
期刊
[摘 要]论述了开发手持式多功能钢轨磨削机的必要性,阐述了该设备磨削、 切割时的工作过程和工作原理,通过该设备在现场中的实际应用情况,提升人机功效。  [关键词]钢轨;道岔;打磨;切割;多功能;人机功效;高效  中图分类号:U213.4 文献标识码:A 文章编号:1009-914X(2017)36-0218-01  1.背景技术  随着高速铁路的不断发展与开发,目前对于钢轨的病害处理基本都是人工磨
期刊
[摘 要]本文主要介绍了舰艇抗爆抗冲击技术的重要性以及国内、国外舰艇抗爆抗冲击技术发展现状,点名我国内舰艇抗爆抗冲击技术发展存在问题,为今后国内舰艇抗爆抗冲击技术发展途径提供建议,以提高我国舰艇的抗爆抗冲击能力,从而提高我国舰艇的军事作战能力  [关键词]舰艇;抗爆抗冲击技术;发展途径  中图分类号:TE805 文献标识码:A 文章编号:1009-914X(2017)36-0210-02  引言:
期刊
[摘 要]就如何选择优良品种重点阐述了科学选种的方法与途径。实践证明,科学选用优良品种是提高玉米种植效益的重要途径。  [关键词]玉米品种效益方法途径  中图分类号:TH443 文献标识码:A 文章编号:1009-914X(2017)36-0238-01  科学选用品种是玉米优质、高产、高效的关键,应根据地力等情况选用几个品种,实现合理的品种结构配置。做到不同生育期的品种搭配种植,喜肥好水与耐瘠抗
期刊
[摘 要]城市建设的不断推进让市政道路建设得到了一定改善,同时也给城市道路工程带来了新机遇和新挑战。在市政道路工程快速发展中,存在的各种建设问题导致的灾害也逐渐涌现出来,确保市政道路工程质量,分析质量控制难点并提出有效的改善措施,在促进市政工程顺利开展方面意义重大。  [关键词]质量控制 市政道路工程 难点分析 对策探讨  中图分类号:U415.12 文献标识码:A 文章编号:1009-914X(
期刊
[摘 要]随着经济的快速发展和和谐社会的构建,我国电力工程也得到了飞速的发展。输配电工程是由多种变电所构成,变压器是变电所的核心设备,只有保证变压器安全、稳定的运行,才能保证变电所的稳定运行,才能确保输配电工程的正常运行。变压器的安装和调试对变压器的运行状态有很大的影响,因此,对输配电工程中变压器的安装和调试进行分析有十分重要的意义。  [关键词]输配电工程;变压器;安装调试;变电所  中图分类号
期刊
[摘 要]玉米要在“稳定面积、提高单产、改善品质、加速转化、发挥区域生产优势”的思想指导下进行生产,才能增加种植效益,促进农业发展。  [关键词]高产玉米栽培原理管理技术  中图分类号:TH423 文献标识码:A 文章编号:1009-914X(2017)36-0237-01  1.高产玉米栽培原理  1.1 玉米的同化源。通过光合作用形成的有机物占植株总干重的95%左右,光合作用形成的有机物的多少
期刊
[摘 要]曙三区由于储层胶结疏松,地层成岩作用差,地层出砂比较严重。随着油田进入中后期,高含水出砂井日益曾多,常规防砂效果逐年变差,严重制约了区块正常开发。为解决出砂及高含水井双重矛盾,研究并应用了控水防砂技术,利用控水砂和清洁携砂液结合实施高压充填防砂施工.实现控水、透油等多重措施目标。现场应用表明该技术增油效果明显,有效地起到了增油控水的作用.  [关键词]高含水出砂井;控水防砂;曙三区;研究
期刊
[摘 要]我国政治改革的不断深入,为很多事业单位尤其是地质勘查单位提出了更高的作要求。现阶段,地质勘查单位在开展思想政治工作时面临着巨大的挑战。基于这种情况,本文对地质勘查单位思想政治工作所面临的困境进行具体探讨,并提出相应的解决对策,以期达到促进地勘单位长久稳固发展的目的。  [关键词]新时期;地质勘查;思想政治工作;困境;对策  中图分类号:TH603 文献标识码:A 文章编号:1009-91
期刊
[摘 要]配电线路是配电网的核心内容,也是影响配电网正常运行的主要因素。通常,配电线路易受到外界因素的影响,包括雷击、树木障碍等,从而致使配电线路的运行异常,给人们的日常用电带来较大困扰。所以,要确保配电线路的运行安全,需要及时处理配电线路中出现的运输故障,最大限度地降低故障带来的影响,为人们提供安全、稳定的电力能源。  中图分类号:TH263 文献标识码:A 文章编号:1009-914X(201
期刊