论文部分内容阅读
随着集成电路工艺的进步以及计算机技术的不断发展,片上多核处理器正逐步取代传统的单核处理器成为未来的主流。然而由于芯片集成度的提高,芯片的能效和可靠性成为阻碍其继续发展的两大问题。一方面随着工艺尺寸的所见和电路规模的扩大,芯片上产生物理失效的概率也越来越大,这将使系统可靠性的急剧下降从而导致运行中出现大量错误。这些错误不但会带来很大的安全隐患,也会导致系统运行结果无效而造成额外的能量消耗。另一方面随着集成电路工艺的进步,芯片的功耗密度也持续增加。功耗过高不仅带来了巨大的能源浪费,同时由功耗密度增加引起的温度升高引起的老化、热噪声等问题对系统可靠性带来巨大威胁。由此可见这两大问题之间是存在紧密的联系,通过优化其中一项也将使另外一项得到一定程度的改善。因此本文针对如何提高片上多核系统能效与可靠性这两大问题,着重从四个关键点展开了研究。本文的主要工作如下:1.对基于共享内存机制的片上多核系统能效优化加以研究,提出了一种基于访存延迟模型和DVFS技术的功耗管控方法。该方法通过预先设定的模型与功耗管控规则直接求解出处理器核心和非核单元的电压/频率,因而实现相对简单高效。与对比方案相比该方法的控制精度更高,系统在运行过程中消耗的能量进一步降低了6.8%-7.9%。该方法为优化片上多处理器系统能效提供了一种更有效的选择。2.对以通信为中心的片上多核系统中动态映射算法对能效的影响加以分析和研究,经典映射算法CoNA的基础上提出了一种带权重的改进型动态映射算法。该算法在任务映射过程中充分考虑了不同任务之间通信量大小对传输延迟和能耗带来的影响。采用该算法实现任务的动态映射比采用经典的CoNA算法平均数据传输延迟降低了2到4个时钟周期,所消耗的总能量下降了2.47%-8.30%。3.提出了一种非阻塞式片上网络在线测试方法,使得多核系统不必在因为片上的实时测试而被阻断数据传输造成系统能效降低。该方法在基本不影响系统正常运行前提下为片上多核系统互联网络的在线实时测试提供一种可行的解决方案,可以在系统运行的过程中及时捕捉瞬时或间歇性故障。从而为后续及时纠正错误避免以灾难性后果提供了基础,也提升系统可靠性提供了基本保障。4.针对各种片上网络故障中“转弯错误”这一相对研究较少却容易造成系统灾难性错误的故障类型加以研究。在分析“转弯错误”成因的基础上,利用片上网络自身的空间冗余和片上网络路由算法的自适应性提升了系统对临时幽间歇性“转弯错误”的容忍程度。采用这一容错方法后数据包的达到率相比于基于DyXY路由方法有明显的提升。该方法不但有效的提升了多核系统的可靠性,也降低了数据重传所带来的额外功耗。