论文部分内容阅读
由于性能价格比高、可扩展性和可用性好等特点,机群系统已成为现代超级计算机和超级服务器的主流并行体系结构.和其它并行体系结构相比,机群系统的主要性能瓶颈在于结点间的互连网络和通信软件,因此设计和实现高性能机群通信系统一直是机群系统研究中的一个关键问题和研究热点.
本文着重研究如何在现有研究成果的基础上进一步提高机群通信系绕f生能.为此,本文首先分析了目前机群通信系统的主要性能瓶颈以及需要进一步解决的问题,然后从降低虚实地址转换开销对通信性能的影响、应用并行通信技术和通信延迟隐藏优化技术三个方面开展研究.
本文的创新点和主要贡献包括:
(1)在BCL-4中实现了一个高效的虚实地址转换机制,并提出"懒惰注销"、"大消息通信流水"和"大通信页面"三种性能优化方法来降低虚实地址转换开销对通信性能的影响.本文在BCL-4中采用基于二级哈希页表结构的虚实地址转换机制,并分别在网络接口和主机方实现哈希页表Cache和已注册通信缓冲区Cache以利用局部性原理优化虚实地址转换性能.此外,本文还采用了"大消息通信流水"方法用于隐藏虚实地址转换开销.在研究通信页面大小对虚实地址转换性能影响的基础上,本文首次提出采用大页面通信缓冲区进行通信以提高通信性能.
(2)提出并在BCL-4中实现了区分消息类型的并行通信机制,并指出并行通信机制不仅能提高结点间通信带宽,还可以提高结点间的消息吞吐率.和区分消息大小的并行通信机制相比,由于只对RMA消息进行分片而避免了接收方多个消息分片的重组过程,区分消息类型的并行通信机制可以获得更好的并行通信效率.在分析通道数和通道结构对通信性能的影响后,本文提出需要将消息吞吐率作为评价机群通信系统性能的重要指标,并指出应用并行通信机制可以成倍提高结点间的消息吞吐率.
(3)提出并实现了基于"必要时等待"的运行时通信延迟隐藏优化技术.通过使得不相关的计算和通信重叠执行是隐藏通信延迟对并行应用性能影响的有效方法,但由于该优化方法需要程序员参与而增加了编程复杂度并具有静态优化方法所固有的不足,本文提出"必要时等待"通信语义以在运行时充分挖掘和利用并行应用程序中可以和通信重叠执行的计算来隐藏通信延迟.实验结果表明,该优化技术可以有效提高并行应用程序性能.