论文部分内容阅读
随着社交网络、图像处理、人工智能的不断发展,对其等效图进行快速分析变得越来越重要。宽度优先搜索(BFS)是许多图算法的基础。但由于算法的访存不规则性,在基于局部性原理设计的计算机体系结构上,访存延迟、cache一致性原理以及内部同步机制等问题都制约了算法性能的提升。本文实现了一种基于FPGA平台的多软核消息传递的体系结构。本设计通过使用访存队列、细粒度并行等多种优化方法,在Virtex-5 VLX330 FPGA平台上取得了500MTEPS以上的性能并且具有良好的可扩展性。