论文部分内容阅读
计算机科学技术的不断发展,使得计算机在科学研究和工程实践领域得到广泛和深入的应用,科学研究和工程实践领域需要借助于并行计算来解决大规模计算问题,并且随着研究工作的深入,这些领域对并行计算的需求也在不断提高,进而促进了并行计算机的发展。然而随着并行计算机系统规模的不断扩大、节点机数量的日益增加,并行计算机系统可靠性也在降低,如果系统中的某个节点出现故障,将会造成整个系统的计算工作失效,从而导致很多大规模的并行应用无法高效运行,严重影响了并行系统的可用性,因而构建容错并行计算机系统就成为并行计算发展的迫切需要。
本文提出了一种基于虚拟机构建并行计算机系统的方法,将并行应用放入到虚拟机中运行,利用虚拟机的硬件无关性和动态迁移功能实现了虚拟机中并行应用程序对硬件故障的容错功能,该方法具有良好的硬件无关性和对用户编程的透明性。
针对现有虚拟机网络设备模型在处理数据包时未能考虑数据包大小、导致小数据包发送开销较大的问题,提出了一种基于共享内存和页面映射相结合的虚拟机数据包发送方法,该方法在虚拟机网络设备发送小数据包时使用共享内存通道,减少了由于页面映射导致的小数据包发送开销,提高了网络性能。
针对现有虚拟机网络设备模型在虚拟机域间通信时效率低的问题,提出了同一物理节点上多个虚拟机域间的共享内存通信方法,该方法缩短了同一物理节点上多个虚拟机域间通信的路径,大幅提高了虚拟机域间的通信性能。
在七O六所研制的“多虚拟机容错并行计算系统”中利用OSU、NPB基准测试程序以及Xenoprofile测试工具对系统的性能进行了测试。测试结果表明,与未使用共享内存通信的原有系统相比,共享内存的使用有效地提高了虚拟机网络性能,并将系统的并行计算效率提高4.2%~13.92%。