高性能计算环境下监控系统中的高可用性研究

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:veiri32
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代,如何保证信息系统及时可靠地提供服务是信息主管部门必须面对的重大课题.随着计算机和网络技术的迅速发展,构建高可用系统,提供稳定、可靠、有效、持续运行的计算机服务成为计算机各个应用领域不可缺少的重要要求,有着巨大的应用前景,受到广泛的重视和研究.传统的双机备份系统由于存在着共享磁盘的单点失效隐患以及服务器资源利用不足的问题迫切要求得到改进以提高效率.因此,该文在综述了基本情况后,结合高性能计算环境数字监控的实际需求,分析了机群系统高可用性理论,根据高可用性Linux计划开发的Heartbeat组件和Linux系统提供的FAM及IMON组件提出整合方案,建立了基于Linux的双机容错系统DFT(Dual Fault Tolerant),包括数据同步、服务监测和失效接管等基本的高可用性功能.详述了系统的设计方法和具体实现.系统的主要特点如下:实现了数字监控系统中心服务器的高可用服务;实现了实时的磁盘同步复制功能,节省了硬件开销,降低了成本;避免了大部分双机容错系统的单点失效(SPOF)隐患;提出了监测服务的分组策略,细化了管理粒度.
其他文献
分布式系统由于具备高吞吐信息服务和海量数据处理能力,在科学计算和金融等领域需求迅猛增长。但随着机器的更新换代及为了满足应用的不同计算需求,分布式集群面临两大挑战,即下
随着互联网的飞速发展,网络中的Web应用也呈现出急剧增长趋势。随着Web应用资源需求的不断增加,各类增值服务迫切要求为其提供基于利润收益的有竞争力的区分服务,而不应该再
随着信息技术和管理理论的发展以及计算机和网络的广泛应用,工作流技术正在成为计算机应用领域的一个新的研究热点。工作流技术起源于办公自动化,后来广泛的应用于图像处理、文
近年来,随着各类信息化设备的普及,设备所产生的数据总规模呈指数级增长。大数据技术为海量数据提供了存储、处理、应用以及可视化等各类功能,赋予用户从各种类型数据中挖掘有价
P2P网络实质上是一个用于分布式对象存储、搜索和共享的覆盖网络。随着P2P应用的日益广泛,例如分布式计算、协同作业和分布式存储,开发这些应用程序需要可靠、有序的组播消息
该文在现有的元数据标准和实现系统的基础上,先对元数据的内容从不同角度进行了研究,接着分析了如何基于XML技术来管理元数据,然后描述了一个基于XML的地理信息元数据系统的
静态分析是软件白盒测试、逆向工程以及再工程等CASE工具的核心基础支撑技术.长期以来,由于C++语言语法的高度复杂性,导致静态分析技术一直是C++语言的CASE工具开发的瓶颈.该
时态数据库是日前数据库领域研究的热点,其具体实现技术以及在现实生活中的应用都具有非常重要的现实意义.目前基于有效时间间隔的时态数据表示模型已经比较成熟,而且被应用
本课题所研究的液压试验台计算机测控系统是对液压系统的高速信号进行捕捉并显示波形曲线的系统.课题针对液压高速信号的采集时机和技术进行了一些研究,开发了一个具有开放结
随着互联网的日益发展,现在使用的IPv4协议在地址数量、服务质量(QoS)和安全性等多方面已经不能够满足人们的要求.在这种背景下,IETF提出并制订了IPv6协议规范.在IPv4向IPv6