机群监控系统关键技术的研究与实现

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:wangkaidi58
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,高性能超级计算机的趋势已从高端的大型高性能计算机向计算机机群发展,促进了机群这一计算技术得到飞速发展。随着机群技术的广泛应用,机群系统的性能和可用性需要也在不断提高,但是机群系统结构松散、节点独立性强、网络连接复杂、故障难以维护。为了解决以上存在的问题,采用在节点机的操作系统上建立一层机群监控系统,它是大规模机群系统中一个非常重要的基础设施,机群监控系统的基本任务是获得机群当前的配置情况,监控机群的健康状况和性能指标,并提供机群系统故障诊断功能。国内外机群监控系统虽具有良好的性能和可用性,但仍存在一些不足:1)机群监控系统在进行信息采集时用户不能及时获取所需的数据信息,会引入较大的系统开销,从而对机群系统产生负载影响。2)当监控节点发生故障时,无法实现故障节点的自动转移和恢复,造成监控数据传输失效,降低机群监控系统可靠性。本文的主要研究内容及创新之处:(1)通过对监控信息采集技术的详细分析,采用IEEE1394协议和Ganglia机群监控技术相结合,设计实现了一种新型的机群监控信息采集模型,该模型不仅降低了机群监控系统对机群系统产生的负载,而且有效地提高了监控信息的采集速率和机群监控系统的可用性。(2)分析了机群监控系统在处理监控节点故障时存在的问题,提出了一种容错的机群监控节点模型,避免了机群监控节点故障,增强监控系统的可用性,提高了无人值守的可信度。本文针对机群监控系统NGMON的主要性能指标──机群监控信息采集引入的负载和通信效率,以及系统的容错性进行了测试,验证了它们的可行性和实用功能,弥补了现有机群监控系统存在的不足之处,提高了机群监控系统的性能、可靠性、可用性和可管理性。本文研究内容是大连市科学技术基金计划项目:新型网络服务器的资源管理与系统状态监控(编号:2005J22JH031)的重要组成部分。
其他文献
网络表系统即AMR(自动抄表)系统,是将计算机技术、现代通信技术以及嵌入式技术相结合,实现对流量计量仪(电表、水表、天然气表等)数据的远程抄收和管理的一种新技术。   就
人们对于图像识别技术的研究始于上世纪的六十年代,它的含义是利用计算机对图像进行处理,从中提取所需的信息,以利于人们对事物进行识别与描述,这一概念属于模式识别的范畴。传统
学位
传统的支持向量机(SVM:Support Vector Machines)算法基于统计学理论和结构风险最小化原则,在最小化经验风险的同时提高算法的泛化能力。全局优化性、推广能力好、非线性核函数的
进程迁移机制是在任务执行过程中,根据负载平衡的要求,将当前的活跃进程透明地迁移到其它节点,并进行恢复执行的一种机制。它是集群系统实现负载平衡的有效策略。进程迁移作
医用液体在生产过程中混入的杂质严重危害了使用者的生命健康。目前采用的人工检测方法受灯检工主观性影响而导致检测效果不够理想,研究医用液体杂质自动检测系统具有重要的
协同过滤算法已经广泛应用于推荐系统中,而基于协同过滤的推荐算法之关键是相似度计算。虽然已经有许多成熟的相似度计算方法,但是基于协同过滤的推荐算法在数据稀疏的情况下
高光谱遥感图像分类是通过机器学习等手段利用高光谱图像的数据特性将传统光谱图像中无法分辨的微小差异的地物通过计算机自动区分归类的过程,具有实际意义和实用性,受到了研究者的广泛关注。本文的工作基于高光谱图像像元的特征和数据结构,针对其执行分类算法时的分类正确率较差、分类算法对像元适应性差、对高光谱图像空间信息利用不足等问题,做了以下三个方面研究:首先,分析稀疏表示分类器(Sparse Represen
分布式实时系统已经广泛应用于各个领域,可靠性要求也越来越高。由于分布式实时系统是时间关键系统,时间是一种重要的资源,输出结果的正确性不仅取决于计算所形成的逻辑结果,
近年来,随着移动设备、嵌入式设备的普及,移动处理、嵌入式应用的大量涌现,以及通用微处理器工艺水平和主频的不断提升,双核乃至四核的出现,计算机芯片工作频率和系统复杂度
随着我国工业的快速发展和国民生活水平的不断提高,废气的排放量也日益增加。空气的质量在不断下降,部分城市的空气已达到严重污染的程度。空气质量的监测已经成为环保管理部