论文部分内容阅读
计算化学作为高性能计算领域的一个新方向,这些年来取得了极大的进展,以Gaussian为中心的多种计算化学方面的高性能计算软件正在帮助理论化学研究者们实现多种计算机实验和推导。由于计算化学领域计算问题非常复杂,采用高性能计算集群将成为理论化学计算的必由之路。而过去习惯于采用小型机进行计算。随着集群技术的发展,大部分理论化学计算软件成功运行在集群系统中,集群的发展将继续推动计算化学研究的不断前进。本文在分析测试了理论化学计算研究中常用计算软件Gaussian的并行计算效率,提出了相应并行计算的合理实现方式。设计了体现集群技术在实际应用中的技术优势,和在集群环境下,给集群用户利用作业提交系统科学编译脚本的有效方案。研究结果总结如下:Gaussian软件通常采用NFS文件系统实现节点间的数据同步和程序的同步,而NFS文件系统的性能取决于在数据通信链路上所采用的网络设备。这就要求数据通信网络,应尽量采用全线速、无阻塞的交换设备。测试并分析了影响理论化学计算软件Gaussian在计算中对系统网络能力需求的主要因素。研究发现,Gaussian软件采用Linda程序并行通信时会进行大量的系统通信和同步,这就要求网络应该具有更好的带宽和更低的延迟。通过对不同数量CPU的加速比分析,发现单节点时,计算效率呈线性变化,跨节点并行时,加速比提高逐渐减缓,当CPU数量增加到32核的时侯,加速比变化已不明显。Gaussian软件是半经验计算和从头计算研究使用最广泛的量子化学软件,可以研究分子能量和结构,过渡态的能量和结构,化学键以及反应能量,分子轨道,偶极矩和多极矩,原子电荷和电势,振动频率,红外和拉曼光谱,NMR,极化率和超极化率,热力学性质,反应路径等,故需要较大的内存支持其运行。研究发现,在整个运算过程中有一个参数(%mem)可以控制使用的内存总量,利用这些内存可以使得很多计算速度更高,同时将该参数提高将可能提高整个运算的运算速度。值得注意的是该参数值的设置并不是越大越好,当该参数达到一定程度时,运算性能不再随参数值增大而提高。Gaussian计算通常是在计算的开始阶段将一些计算内容写入一个文件中,然后在后面的计算过程中不断地修改这个文件并最终获得计算结果,所以Gaussian计算的时候会在开始阶段出现整个运算过程的IO最高峰,并在后面计算的过程中始终保持较小的IO。在对该软件充分调试和分析的基础上,利用高性能计算平台进行大量的计算研究工作。本文以对人类胞外信号调节酶1的研究为例进行了详细阐述。