InfiniBand集群可视化监控系统的研究与实现

被引量 : 0次 | 上传用户:huainanyan_sxnu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集群(cluster)是指由高性能网络或局域网物理地互连的计算机(节点)的集合,是可扩展并行计算体系结构的一种具体实现方式。集群做为一种低成本、高性能的并行计算机系统,在并行处理工作中应用广泛。集群系统监控是掌握系统各节点运行状况和性能发挥情况的重要手段,监控系统根据不同的结构和用途,目前的开发多种多样。 本文针对目前使用带宽达20Gb/s的InfiniBand高性能网络搭建集群时常用的系统结构,重点研究以下几个方面: 监控系统对集群造成干扰的原因和降低干扰的可行办法。监控系统对集群系统的干扰主要是频繁的数据采集和网络传输所占用的带宽,另外非法用户的入侵和闲置系统服务对系统资源的占用也是造成干扰的一个因素,文中提出可行办法改善这一状况。 文中提出使用二叉树结构进行扩散式快速收集监控数据,有效提高监控数据收集效率。二叉树的分层结构有助于消息的快速扩散,且由于各个节点并行运行,信息收集时的同步效率提高。二叉树的节点增长速度较快,因此,在集群系统规模扩大时,更能体现其优越性。 集群系统的安全检测是保障集群系统不受干扰、安全稳定运行的重要手段,文中根据监控系统结构,提出网络安全检测和系统安全检测的方法。 最后结合集群监控软件CLS的设计和开发,研究降低监控系统对集群的干扰和扩散式收集监控数据方法的可行性,并实现相关算法。CLS采用三层监控结构,改善以往采用两层结构时对节点资源的过多占用,CLS将监控系统与集群的主控节点分离,添加监控服务器,负责监控数据的收集和安全检测,并且将大部分数据交由监控服务器处理,大大降低驻留程序在节点机上的资源占用,最后介绍监控软件的可视化开发和基于Web监控的实现方法。 文中深入分析如何降低监控系统对集群的干扰以及快速准确地采集数据的方法,对于任何规模的集群,监控系统都可以正常、稳定的工作,提高监控系统的可移植性和可扩展性,本文的研究对开发大型集群系统的监控软件时,提高监控效率,降低对集群系统的干扰具有很好的应用价值。
其他文献
<正>一、课题研究的背景进入21世纪以来,科学技术进步的跨越式发展,知识经济的到来,使人们更加认识到教育的重要性,在国际竞争中,教育是社会的进步和经济的发展和试点的基础
会议
随着物联网技术的飞速发展,物联网应用成为新的经济增长点,在应用中出现的数据传输瓶颈问题成为海内外相关学者研究的重点。物联网在数据传输时容易在网关中出现网络拥塞问题
典籍文献包含了一个民族的思想和灵魂,是记录和传承文化的重要手段。对一个国家而言,国家典藏是国家统治、社会管理、物质生产和文化建设的基础和需要,是统治阶级文治武功的
8月27日,国办发布了《国务院办公厅关于加快发展流通促进商业消费的意见》,其中,第十七条是扩大成品油市场准入的意见。该意见提到取消石油成品油批发仓储经营资格审批问题。这
报纸
选矿过程是将原矿向精矿转化,保证后续冶炼作业高效、顺利进行的必要工序。而选矿过程的工作效率主要取决于磨矿作业对矿石粉碎细化的能力以及浮选作业对精矿的回收率。这其中
文章以丁香假单孢菌处理的哥伦比亚型拟南芥为植物材料,利用RT-PCR技术获得了拟南芥WRKY35转录因子的cDNA编码序列。序列分析表明,WRKY35核苷酸序列长1363bp,CDS全长1314bp,
目的 :探讨子宫肉瘤的诊治经验及预后分析 ,以改善其生存率。方法 :作者对本院近 12年来收治的 19例子宫肉瘤的组织学类型、临床特点、治疗方法及预后进行分析。结果 :该病的
<正>【案例背景】内部控制是为了积极应对复杂的金融环境,及时解决央行事业发展和金融创新中存在的问题和风险,有效防范和化解风险,提高金融服务,促进基层央行职能履行,中国
我国《刑法》与《刑事诉讼法》对社区矫正的明文规定催生了《社区矫正法》的制定。尽管社区矫正作为我国的一项法律制度历经了试点与法律确认,但在一些基础性问题上仍模糊不
目的探讨亚低温治疗重型颅脑损伤的最佳温度、时机和时限.方法对208例重型颅脑损伤用正交实验设计,以GOS评分、颅内压和并发症为指标,观察亚低温治疗的不同温度、开始时间、