论文部分内容阅读
移动计算和数字多媒体的应用成为后PC时代的趋势已经是一个不争的事实,数字集成电路不断向专用化发展。面对大规模的数据量、计算量的需求,应用工程师发现各种处理器的功耗无法满足他们的设计要求,漫长的开发周期与设计收敛并快速上市成为一对无法调和的矛盾。为了解决这一问题,在低功耗设计领域,研究人员对门控时钟展开了大量的研究,它的基本思想是:通过减少数字电路的无效翻转次数来实现动态功耗减少的目的。在具体的实现上,当前主流的方式集中在电路级,通过对数字电路的逻辑进行分析,自动化的插入门控逻辑进行优化。此外,由于芯片规模和功耗的不断增加,带来测试的复杂度的增加,芯片在测试过程中损坏的风险大大增加。高强度的测试电流和过热往往导致在测试过程中对正常的芯片产生永久性破坏。此外,在供电回路的电源和地之间高密度的电流变化产生的噪声干扰到电路的正常工作,这导致正常的芯片在测试过程中失效,带来生产良品率下降。针对可测试设计的低功耗设计技术成为研究人员的关注焦点,希望能够提出新的设计方法和流程,它们能够对现有的主流设计方法不进行大的改动,实现最小代价地与当前的设计流程连接。本文首先介绍在处理器低功耗设计方面的基本概念和主要的研究内容,然后对其中的四个关键性问题进行研究,它们是,可复用的VLIW数字信号处理器原型、低功耗门控体系结构、有效的指令系统扩展、低功耗可测试性技术和设计方法学。为了验证从原型到低功耗设计的有效性,我们基于TSMC0.18微米工艺的技术对我们设计的低功耗DSP原型—Ares进行电路仿真,结果证实了用我们的方法,能够实现以较小的代价获得非常有效的功耗性能。针对当前日益标准化的视频编解码算法和通讯编码系统,我们对DSP的指令系统进行了有效地扩展,通过增加小代价的专用微体系结构有效提升DSP的运算效率。为了验证我们提出的基于分割的低功耗可测试性设计技术的有效性,我们在一款基于TSMC0.18微米的ARM9 SOC芯片的可测试性设计上应用了这一方法,实验结果证实了在测试过程中,我们获得了理想的测试覆盖率和较高的良品率。本文的贡献和创新性工作主要体现在以下几个方面:提出一种超长指令字DSP的虚拟原型,该原型具有一定的RISC结构特点,可看成是具有多个RISC微结构的并行处理器结构。该微结构试图将一个已有的VLIW指令系统映射为一个由多个可扩展的RISC结构组成的静态超标量结构,在此基础上,我们实现了命名为Ares的16位指令系统的VLIW结构。在Ares结构的基础上提出了一套减少无效时钟翻转的有效方法,把流水线的动态功耗降低到最小。提出了基于资源冲突监测的早期预测算法,对每一条独立通道的各级流水线结构进行了优化,同时给出了一个完整的Ares的时钟布局结构,实验数据显示了该算法能够在有限的附加电路的代价下实现非常显著的动态功耗优化。针对DSP的视频编解码和通讯编解码应用,提出了更高效的DSP指令扩展的方式以及高性能、低开销的微体系结构。提出了一种高性能、低开销的SAD微体系结构、一种高性能的AVS整数反变换结构和一种针对超长BCH码的高密度纠错结构。针对可测试性设计(DFT)的领域中遇到的功耗问题,提出了基于多时钟域的电路分割方法和EDA设计流程,并将其应用于大规模的生产测试实践中。在此基础上进一步提出了基于二部图的电路自动分割方法,该算法能够将分割电路带来的附加电路面积进一步降低,同时不牺牲电路的故障覆盖率和电路分割的“合理性”。