论文部分内容阅读
随着芯片集成度的提高,片上计算节点和存储节点的增多,现有的片上互联技术遇到了瓶颈,片上网络作为一种新的具有高可扩展性的片上互联技术被逐步采用。片上网络的通讯中,通过对数据流的控制可以有效地对通讯性能进行优化。在对于片上网络研究中,通讯合并是一种片上网络上多个不同路径的数据流合并成一个的机制。前人研究的通讯合并多用于多播通讯的实现,较少研究考虑对多播以外的应用程序通讯合并的优化;同时前人对于应用程序片上通讯行为的可预测性和均匀程度研究不足;且较少研究将片上网络高速通道和通讯合并结合。
本文在分析了应用程序的特性之后,指出并量化评估了应用程序片上通讯具有的可预测性,因此证明可以使用应用程序历史信息分析应用程序特性。并且,本文在用节点收发包数标准差量化分析应用程序各个节点通讯的均匀程度之后,得到“应用程序的均匀程度随着应用程序的不同和应用程序所处阶段的不同而不同”的结论。应用程序片上通讯比较不均匀的时候,便于优化,因此本文认为可以用通讯合并造成应用程序不均匀,结合高速通道优化应用程序。
本文提出了基于代理的片上网络通讯合并优化方案,在应用程序两个节点之间进行通讯时,通讯先发送到起点的代理,然后发送到终点的代理,再发送到终点。代理的使用使得应用程序的均匀程度下降。本文提出基于高速通道的代理间通讯,在代理之间采用高速通道连接,从而减少代理间通讯的延迟,使得通讯合并能为整体性能带来正面效应,并给出了三种高速通道的参考实现。之后,本文提出了选择性使用代理的机制,对于同代理节点间的通讯和不同代理临近节点间的通讯不使用代理,使得代理的使用更加合理;并且给出了代理的位置和代理的数量的方案,评估了几种不同的代理配置,认为8×8的mesh片上网络中8个代理是比较优化的配置;最后,本文评估了在缓存减小的情况下代理机制的性能,认为代理机制可以通过减少缓存,在减少片上网络面积的情况下提高网络性能。
通过基于实际应用程序和周期精确的片上网络模拟器上的实验,本文评估了基于代理的片上网络通讯合并。实验证明,相对于64个节点的标准mesh网络,当使用8个代理,本文的方案可以在基本不增加面积的情况下减少23.5%的延迟,或者在减少14.1%的面积的同时减少7.9%延迟。