论文部分内容阅读
提高微处理器的整体性能是广大计算机研究者们不断追求的目标。目前半导体工艺水平的飞速发展,为芯片的有效设计提供了极为广阔的空间。如何有效利用这些不断增长的片上资源,开发出更快、更高效、应用面更广的微处理器,是当前计算机体系结构进一步发展面临的极为重要的课题之一。本文以提高处理器的效率为目标,针对其中的关键技术进行了深入的研究,主要取得了以下几个方面的研究成果:为解决处理器时钟频率难以提高、超标量流水线所面临的流水线停顿问题,文中提出一种LBC异构多核处理器的结构设计方案。该结构中设计了Loop检测器、特殊指令队列Backup Ins Queue、C-Core控制器,以及用于E-Core间的快速数据共享通道C-Bus总线,这种LBC异构多核处理器不仅对程序中大量存在的loop程序进行了优化处理,而且避免了流水线因分支预测失误而flush,提高了整个处理器执行效率;针对MSI协议和MESI协议进行了深入分析研究,指出其在存取时间、访问延迟及总线负担三个方面存在的缺陷,提出了在原有CMP体系结构中增加SC-Cache的方案,用于存储含有多个处理器共享副本的块信息。针对增加的SC-Cache与其它Cache及主存之间的协作管理,设计了一种CSC监听协议。仿真测试数据表明,该设计优化了Cache一致性方面的实现开销,整个存储器性能得到一定的提升;对分支特征库进行数据统计分析,发现分支程序中有很大部分属于loop类型程序(即循环程序),而在目前的处理器微体系结构设计中对loop型程序并没有进行很好地优化处理。本文针对这一不足提出了一种loop检测器的结构设计方案,从而避免了处理器对loop型程序的重复译码;对超标量流水线中GAs两级动态分支预测器的预测精度进行数据统计,发现指令分支预测存在约6%-16%的预测失误,而每次预测失误后,恢复流水线一般需要三个时钟周期。针对这一问题,本文提出一种B-Cache分支预测失误恢复器的结构设计,使指令预测失误后的恢复时间由三个时钟周期降到只需要一个时钟周期。