GPU流水线中背面剔除的硬件设计和实现

来源 :第七届中国测试学术会议 | 被引量 : 0次 | 上传用户:kenching
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  消除隐藏面(hidden surface,简称消隐)丢弃了看不见部分,保留了可见部分,这样,不仅可以加快图形的处理速度,同时不会减少图形逼真性与图形真实感性。本文介绍了GPU流水线结构并研究了基于GPU流水线的背面剔除算法的硬件实现,通过采取优化措施,处理速度得到大幅度提高。本文还用SystemVerilog语言行为建模搭建验证平台,对硬件模块进行验证,提高了硬件设计的准确性。
其他文献
三维集成电路是通过硅通孔将多个相同或不同工艺的晶片上下堆叠并进行垂直集成的新兴芯片集成技术。通过这种集成,芯片可获得更小的外形尺寸、更高的片上晶体管集成密度、单片上能集成更多的功能模块以及更高的互连性能等显著优点。然而,三维集成电路也带来了诸如TSV电迁移效应等新挑战。本文提出了一种抑制TSV电迁移效应的可靠性设计方法。首先,针对镀铜气泡、绑定非对齐和绑定界面尘埃沾染等TSV缺陷,分析了制造缺陷和
基于振荡的测试方法(OBT)对待测电路进行重构,使其产生稳定的振荡波形。传统的OBT方法得到的振荡波形为单频正弦波,以频率和幅值作为故障特征建立故障字典,故障覆盖率较低。为了提高故障定位能力,本文尝试以简单的附加电路产生多频振荡波形,利用频谱分析增加新的故障特征,并讨论了该方法的可行性和需要解决的问题。
集成电路工艺水平提高的同时,老化效应严重威胁了电路的可靠性.本文针对电路老化导致失效的问题进行研究,提出了一种基于时-空冗余技术的失效防护方法.该方法针对老化的行为特征,采用冗余的时序单元对数据路径进行加固,并通过多时钟技术控制时序单元.实验数据表明,本方法在ISCAS89电路中的平均面积增长率为41.43%;在冗余时钟相位差达到时钟周期的20%时,可以有效将电路的平均故障间隔时间(MTTF)提高
高扇入多米诺或门是高性能集成电路中常用的动态电路,而负偏置温度不稳定性降低了多米诺或门的噪声容限并增大了其传输时延。本文提出了带有补偿晶体管的多米诺或门结构,通过开启补偿电路,使电路在老化以后仍然能够保持其抗干扰能力和传输延时,有效的延长了多米诺电路的使用寿命。
随着制造工艺的不断进步,老化效应导致的动态参数偏差和漏电给集成电路的可靠性带来了严峻挑战。目前关于电路老化和漏电的协同优化方法或者以侵入式方法实现,或者采用输入向量控制方法(IVC)。然而,侵入式方法会增加设计复杂度,并引入较大的时延和面积开销;而IVC方法则会随着电路规模的增大逐渐失去其优化效果。本文提出了一个新的协同优化模型以最小化电路处于待机模式时由于NBTI效应导致的时延偏差和静态漏电。提
为了满足系统芯片对通信带宽的要求,片上网络逐渐成为多核处理器互连的主流方案。然而随着集成电路技术进入纳米时代,由于制造缺陷、电粒子轰击等原因,片上网络出现故障的可能性明显增大,严重时会导致整个系统崩溃。以往的容错技术允许片上路由器分时复用其它正常工作的数据通路分片,以提高路由器的容错能力,降低传输延迟。然而,随着故障分片数量增多,路由器的可靠性和性能会受到严重影响。本文基于数据通路部件可分片的特点
随着SoC芯片集成度和复杂度的不断提高,其测试变得越来越复杂,测试成本也越来越高。按照目前的发展趋势,测试成本将有可能超过芯片自身的设计和制造成本,如何降低过高的测试成本也逐渐成为研究的热点。本文基于片外信号源方法提出了一种低成本SoC测试方案,并在自动测试系统T6575上实现。本文的研究方法对同类芯片低成本量产测试具有现实参考意义。
测试压缩下的功耗问题已经成为近期研究的热点。本文提出了一种新的低功耗广播式测试压缩结构,通过有限状态机控制一半的内部扫描链在扫描过程中接收持续的常数0,另一半的内部扫描链接收来自扫描通道的测试激励,实现了广播式压缩环境下对内部扫描链选通的自动动态控制。为了提高故障覆盖率,在低功耗广播扫描模式之后增加了串行扫描模式。实验结果表明扫描移位功耗和捕获功耗可降低50%-60%,故障覆盖率可达到无损,不需要
三维堆叠集成电路测试中的一个关键的挑战是在功耗约束下,在绑定前测试和绑定后测试中,协同优化测试应用时间和测试硬件开销.将传统的二维芯片的绑定前和绑定后测试调度方法运用于三维堆叠集成电路的测试调度会导致测试应用时间的延长.我们分别针对未堆叠的集成电路和N(N≥2)层芯片堆叠的3D-SICs,提出了一种功耗约束下的测试调度优化算法.在ITC02基准电路的实验结果表明,算法在功耗约束下,测试应用时间和测
本文提出一种基于FDR编码高效测试数据压缩的扫描树结构.首先,我们分析了扫描树技术和FDR编码技术结合的高效性.然后,我们提出了一种扫描树构造方法来降低确定位的数目,以进一步提高FDR编码的效率.实验结果表明,对于大的ISCA89电路,我们提出扫描树与FDR,ALT-FDR结合的方法比仅使用FDR,ALT-FDR平均分别多降低了16.65%,14.73%.我们提出的方法也优于当前的基于编码的方法.