【摘 要】
:
随着物联网和边缘计算的快速发展,智能终端设备由于在硬件资源与供电上受到较强限制,迫切需要满足低功耗要求的新型计算单元。作为一种具有广泛应用前景的高效低功耗计算范式,近似计算(又称为非精确计算)在图像处理、深度学习、物联网、边缘计算及实时信号处理等领域均已表现出明显优势。在这些具有良好容错性的应用中,近似计算通过产生近似的计算结果(足够好但不完全精确的计算结果),获得性能和功耗的大幅优化。因此,相比
【基金项目】
:
国家自然科学基金重点项目“集成电路近似计算基础理论与设计方法”(编号:61834006); 国家重大科研仪器研制项目“纳米集成电路边缘缺陷测试分析仪研制”(编号:62027815); 国家自然科学基金面上项目“基于TSV测试与容错的3D芯片良率提升方法研究”(编号:61674048);
论文部分内容阅读
随着物联网和边缘计算的快速发展,智能终端设备由于在硬件资源与供电上受到较强限制,迫切需要满足低功耗要求的新型计算单元。作为一种具有广泛应用前景的高效低功耗计算范式,近似计算(又称为非精确计算)在图像处理、深度学习、物联网、边缘计算及实时信号处理等领域均已表现出明显优势。在这些具有良好容错性的应用中,近似计算通过产生近似的计算结果(足够好但不完全精确的计算结果),获得性能和功耗的大幅优化。因此,相比于精确逻辑电路,近似计算的电路更加简化,从而有效降低功耗,提高性能。乘法器作为基础运算单元,其功耗的降低与性能的提升对于处理器具有重要意义。本文主要研究了基于近似计算技术的低功耗近似乘法器设计与应用。提出了一种无偏近似4-2压缩器设计方案,其误差补偿特性有效提高了近似乘法器的计算精度;基于所提出的各种近似模块完成了两种无偏近似乘法器(Unbiased Approximate Multiplier,UBAM)设计,分别为UBAM-M1乘法器与UBAM-M2乘法器。本文的主要研究内容与创新点如下:(1)提出了一种无偏(产生正、负误差的概率相同)近似4-2压缩器设计方案,使得位于乘法器部分积阵列同一列上的近似4-2压缩器产生的计算误差相互抵消的概率提高,有效降低了近似乘法器的整体误差。(2)给出了两种无偏近似乘法器设计方案。其中,高精度UBAM-M1乘法器的设计目的是提高近似乘法器的计算精度。而低功耗UBAM-M2乘法器有效结合了截断技术、近似压缩器等多种近似方法,为低功耗近似乘法器的协同设计研究提供了一种新的有效解决方案。实验结果表明,与已有近似乘法器相比,UBAM-M1乘法器在计算精度方面明显提升,UBAM-M2乘法器降低了22%以上的延时与28%以上的功耗,节省了26%的芯片面积,在功耗延迟积(Power-delay Product,PDP)与能量延迟积(Energy-delay Product,EDP)方面分别优化了大约39%与46%。(3)在图像滤波应用中验证了本文所提出的近似乘法器的有效性。实验结果表明,高精度UBAM-M1乘法器处理后的图像质量明显提高;低功耗UBAM-M2乘法器仅以1.24%结构相似性(Structural Similarity Index,SSIM)劣化为代价,降低了58.12%的PDP。
其他文献
MEMS扫描镜作为MEMS激光雷达系统的核心部件,是一种获取空间物体三维信息的微执行器。近年来,随着智能化汽车的快速发展,MEMS激光雷达逐渐成为智能驾驶汽车的核心传感器之一,并得到了广泛的关注和研究。车载激光雷达的应用环境对MEMS扫描镜提出了以下要求:要求具有较大尺寸的反射面积;要求在较高频率下运动(k Hz量级);要求具有较大的偏转角度。这些要求成为高精度和高分辨率MEMS扫描镜发展过程中亟
随着人工智能和物联网移动应用的快速发展,人脸识别、增强现实等新型应用被广泛地应用在各种移动设备中。然而移动设备受到体积、电池容量等因素的限制,难以满足新型应用对时延和能耗的需求。移动边缘计算技术的出现为解决该问题提供了新的方式,该技术将计算密集型的应用卸载到计算资源丰富的边缘服务器上执行,有效地降低计算任务的执行时延和能耗,提升运营商对用户的服务质量。但移动边缘计算技术在带来诸多优势的同时,也存在
合成孔径雷达干涉测量(Interferometric Synthetic Aperture Radar,In SAR)是一种主动式三维遥感测绘技术,它具有观测范围大、测量精度高,可以全天时、全天候对地面进行观测的优点,在数字高程重建、地表形变监测、冰川运动研究等领域具有重要的应用价值。为获得可靠的In SAR测量结果,需要对干涉数据进行高精度的处理。然而,由于干涉数据间失相干效应以及干涉相位周期性
异构多核处理器为嵌入式系统的发展注入了新的活力,由于其集成了多种不同类型的处理核,能够满足多样化的应用需求。相比传统的同构平台,异构多核平台能够极大地提升系统的性能。然而,随着处理核数量和类型的增加,系统资源分配问题也变得愈加复杂。异构多核系统中的映射问题,抽象出来就是如何基于优化目标(性能、能耗等)将任务分配到处理核上,合适的映射方案能够极大地提升系统性能。通常,应用在执行过程中,程序不同的执行
机器对机器(Machine to Machine,M2M)通信以全机械自动化的环境为基础,通过有线或无线链路接入智能设备,使其无需人工直接干预即可互联互通,是下一代通信系统中一项很有前途的技术,广泛应用于智能电网、公共监控、智慧交通、电子医疗保健等领域。目前,M2M主要依靠传统网络进行通信,而传统网络起初是服务于人对人(Human to Human,H2H)设备通信的,又因M2M与H2H通信系统之
伴随现代导航技术的飞速发展,中国自主建设了北斗卫星导航系统,可为全球范围内的军民用户们提供海、陆、空导航定位和授时服务,北斗卫星导航系统的建立快速推动了中国的安全和经济发展等领域的发展。在北斗的高精密定位中,载波相位差分是主要的一种定位方式,主要依赖于载波相位观测值,而周跳是载波相位定位过程中常常遇到的问题,周跳的发生将使载波相位观测值发生变化,大大降低定位精度,因此准确地探测和修复周跳对北斗卫星
作为高精度探测仪器,有源相控阵雷达的阵面天线均能独立收发电磁波,因而有源相控阵雷达能够高效、准确、稳定地探测和跟踪目标,使得它在军事、导航和通信等领域中拥有极其重要的作用。有源相控阵雷达在工作时,由于天线热源的热功耗使得阵面发生热变形,一定程度上恶化了雷达的馈电性能,因而对雷达热变形的仿真预测和补偿研究是提高雷达性能的重要措施之一。采用传统有限元仿真由于并未考虑结构的形体边界约束带来的非相似性热变
伴随着互联网技术的快速发展,基于定位的服务已经融入了我们的生活,变成日常生活中不可缺少的一部分。而随着移动设备的快速更新,许多的移动应用也嵌入了定位功能。在室外环境下,北斗定位系统,全球定位系统(GPS),伽利略系统等等基于卫星信号和雷达的定位技术已经非常成熟,并且由于具有抗干扰能力强,精度高,实时性好等特性,这些定位系统已经可以满足广大人民的日常生活需求。但是在人们经常活动的室内环境中,GPS等
随着集成电路技术的发展,工艺制程逐渐逼近极限,单核处理器已经进入了瓶颈期,多核处理器应运而生,受到了广泛的关注。任务调度算法是多核处理器并行计算能力能否充分发挥的关键因素之一。在对现有多核处理器静态任务调度算法广泛研究的基础上,以基于复制的任务调度算法作为研究对象。针对现有算法中存在的关键路径估算误差较大、解空间搜索不充分等问题,分别提出了面向异构多核处理器的带资源约束的任务复制调度算法TDSA-
随着处理器的发展,仅仅依靠处理器的单核性能来提升整体性能已经遇到了瓶颈,多核处理器的计算并行化是现在以及将来研究的热点,如何合理调度所有的计算单元,使得系统的计算能够并行化展开,提升计算单元的利用率将是提升多核处理器计算性能的关键。围绕上述问题,本文设计了一种面向异构多核计算系统的动态任务调度控制器。通过对系统计算行为的分析,主要实现了动态监控计算单元的负载情况、动态任务唤醒、任务并行性自动提取、