论文部分内容阅读
多核时代的到来使得处理器性能的提升步伐得以继续延续,但多核的出现也带来了很多技术上的挑战。片上通信模块作为处理器内部各IP模块进行数据交换的传输通道是SoC(System on Chip)设计中的核心技术。如何设计高性能、低成本、低延迟、高并行性和可扩展的片上互联结构已经成为近年研究的热点,也是在进行多核SoC设计时首要考虑的问题。基于共享总线的片上通信方式虽然结构灵活、易实现,但由于其扩展性差,已难以满足多核SoC的发展需求;采用交叉开关或者片上网络的片上通信方式虽然传输带宽高、扩展性好,但结构复杂、设计成本高。多核SoC复杂的设计要求使得人们开始尝试一种混合互连的通信结构,采用不同的通信结构组成一个整体的片上通信模块,不同的互连结构满足不同IP模块间通信的带宽需求。本文提出了一种共享总线与交叉开关混合互连的片上通信结构,并用其实现内部集成四个处理器核的多核SoC片内通信。其中,片内处理器核与其他功能IP模块之间采用当前最为通用、技术相对成熟的AMBA3.0 AXI总线实现互联。处理器核需要占用AXI传输通道时,首先需要向总线发出占用请求,得到仲裁允许后便可以通过总线传输通道与从模块进行数据通信,仲裁器避免了处理器核之间出现资源竞争的现象。另一方面,基于AXI总线的多核SoC设计通常采用共享Cache结构实现核间通信,该种核间通信结构的工作效率会随着内核数量的增加而降低。本文为了满足四个处理器核之间的高效率通信,采用交点队列型交换结构实现处理器核之间点对点的分布式互连,形成内置分布式交点队列的AXI总线结构。交点队列型交换结构是一种新型交叉开关,其结构相对易实现,且传输效率高。本文首先在已有的研究基础上确定了交点队列结构内部最佳的调度算法,并结合排队理论的知识,采用MATLAB/Simulink工具建立了一个4×4形交点队列结构模型,通过仿真结果确定了其内部缓存队列的最佳深度。在此研究基础上,本文对所设计的片上通信结构进行了RTL设计,并对RTL代码进行了仿真与验证。仿真与验证的结果表明,本文所设计的内置分布式交点队列结构能够完整地实现片上通信的各方面功能。最终,该片上通信结构已具体应用至某四核SoC项目中,并已成功流片。