集群监视技术研究与系统实现

来源 :中国科学院高能物理研究所 | 被引量 : 0次 | 上传用户:wendiii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
20世纪80年代,分布式计算开始作为高性价比的解决方案提供给高性能计算用户.从最早出现的工作站网络(NOW)到集群计算,再到今天的网格计算,分布式计算技术在过去的20年中经历了巨大的发展.高性能计算与高能物理实验从来都是密不可分的.中国科学院高能物理研究所计算中心,为高能所高性能计算环境的建立做出了巨大的贡献.从最早的惠普集群,到NQS集群,到PBS集群,再到今天采用Globus Toolkit技术的网格计算,计算中心正在建立以BES_Farm,IHEP_Farm,YBJ_Farm,LHC_Farm四个集群为基础的网格计算环境,并部署了AFS网络文件系统和存储局域网(SAN)的网络存储环境.同时,高能所已经加入到LHC计算网格(LCG)项目中.管理如此巨大的系统是一件非常繁琐和具有挑战性的工作,因为构成计算环境的节点是为用于单独工作而设计的PC机.我们设计开发了基于SNMP(简单网络管理协议)的集群监视系统IF-Monitor.IF-Monitor面向单一集群计算环境,但是随着校园网格项目的部署,IF-Monitor已经不能满足现在计算环境的需求.在IF-Monitor的基础上,我们设计开发了面向多集群计算环境以及网格计算环境的监视系统IG-Monitor.IG-Monitor是基于Ganglia技术实现,并具有监视整体计算环境,计算集群,计算节点三个层次的功能.IG-Monitor主要由后台守护进程以及前台的Web页面组成.IG-Monitor现在用来监视高能所高能性计算环境.监视内容包含4个Linux计算集群,超过100个CPU.随着网格计算环境的部署,我们将努力把IG-Monitor做成适合高能所计算环境的监视系统.
其他文献
数字化反馈技术正在成为大型加速器控制系统中的一项重要技术,它可以有效地克服许多影响束流轨道稳定的动态因素,例如地基振动、电源纹波、涡流效应以及环境温度的变化等。本论
期刊
可见光视频诊断系统既是EAST托卡马克系统安全运行和放电调控的必不可少常规诊断设备,同时也是研究高温等离子体运动与相互作用规律的有效手段。本论文在系统分析国内外重要聚
当你进行估算时,你不是在寻找一个确切的数字。而是一个粗略近似的结果。只要它和真实的数据在一个数量级上。你就已经做得很好了。    一个国家的所有人一年开车行驶的总里程数是多少?  多少个乒乓球紧密排列可以绕地球一周?  一个100万千瓦的核反应堆每年会产生多少核废料?  随着科学的进步和经济的发展。越来越多的大数字开始折磨我们的大脑。比如那些稀奇古怪的物理常数,它们要么很大,要么很小;又比如金融危
兰州重离子加速器冷却储存环(HIRFL-CSR)真空系统是一个超大型超高真空系统,系统全长约500米,系统由1000多个非标加工工件、真空获得设备、真空计和阀门构成,与各类磁铁、电
太赫兹(THz)技术在近几十年发展十分迅速,作为一门受到许多领域关注的热点技术,其在通讯、安防、无损检测、高灵敏度传感器方面都具有巨大的应用潜力。越来越多的研究表明,热点
随着加速器物理与技术的不断发展,带电粒子束流光学从线性理论到二级像差理论,现在已发展到高阶像差理论,李代数方法是进行高级像差分析的有力的工具之一。李代数方法是在电动力
该文主要介绍了HT-7U极向场电源分布式实时监控系统的设计及实现.首先,该文从实时监控系统设计原则出发,结合系统实际需求,通过诸多方案的对比和筛选,提出了多层子网的系统结
随着深亚微米技术的出现和集成电路制造工艺的进步,集成电路从超大规模集成电路阶段发展成为片上系统(SoC)与片上网络(NoC)阶段。SoC设计的方法主要有软硬件协同设计、设计复用和
该文首先简要地介绍了CSR控制系统的基本思想和前端控制服务器系统,引出前端控制服务器系统的嵌入式技术实现方案.然后对CSR控制系统的被控对象,目前现场总线的发 展和嵌入式