【摘 要】
:
近年来随着智能硬件和5G技术的发展,智慧安防、生物医疗、汽车电子等强实时性应用开始快速兴起。与此同时,AI任务日益复杂,神经网络所需算力越来越大,这使得无论是云计算或边缘计算都无法满足终端设备低时延、强算力的需求,为解决上述AI技术应用困难的问题,神经网络的硬件加速具有重要研究意义。对终端硬件而言,FPGA具有低功耗、高性能的特点,又比专用ASIC芯片更灵活,且开发成本低,十分适用于算法更新频繁的
论文部分内容阅读
近年来随着智能硬件和5G技术的发展,智慧安防、生物医疗、汽车电子等强实时性应用开始快速兴起。与此同时,AI任务日益复杂,神经网络所需算力越来越大,这使得无论是云计算或边缘计算都无法满足终端设备低时延、强算力的需求,为解决上述AI技术应用困难的问题,神经网络的硬件加速具有重要研究意义。对终端硬件而言,FPGA具有低功耗、高性能的特点,又比专用ASIC芯片更灵活,且开发成本低,十分适用于算法更新频繁的AI应用场景。然而目前多数硬件加速方案为静态重构的架构,无法根据不同需求动态调整内部结构和功能,并且缺少对残差神经网络等新型结构的硬件支持。针对上述问题,本文面向残差网络的应用,开展网络轻量化方案和动态可重构架构的研究,提出一种动态可重构的残差网络硬件加速方案,论文主要工作与创新点如下:1、针对神经网络部署困难的问题,本文基于软硬件协同设计思想,提出了一种Supertile-INT8动态量化方案,使计算单元频率达到系统主频的2倍;使用INT8权重拼接计算技术,配合补偿因子修正结果,卷积计算速度可提升4倍。2、针对当前硬件加速器通用性较弱,难以适配不同网络的问题,本文提出一种混合粒度的动态可重构架构,可根据预配置信息弹性控制计算通路,在不同的网络加速任务中选择最优的计算模式。3、针对传统硬件加速器算子支持单一的问题,本文提出了一种残差网络硬件加速方案,通过额外片上缓存存储残差数据,减少了计算时延。以加速Res Net-50为例,本方案处理速度可达156.7帧/秒,算力约为ARM设备的4.35倍,能耗比可达53.67GOPS/s/W。论文基于Xilinx xcku060芯片和Vivado开发平台,完成了动态可重构的残差网络硬件加速器的系统设计、功能仿真及性能评估。通过实验论证,本文所设计系统具有能效比高,可扩展性强的特点,为实际工程应用奠定了基础。
其他文献
电视节目策划是以提高节目质量为目标,凭借节目所拥有的特色,最大限度地扩大节目的核心观众群,以此来提高节目的收视率。而优质节目是观众保持忠诚和收视率稳定的重要前提,具有创新意识和创新精神的节目策划者能够以标新立异的思维方式和策划理念去审视新现象、表达新内容、带来新视点,收获观众对于节目的认可度以及忠诚度。在数字技术快速发展的今天,人工智能技术、虚拟现实技术为电视节目带来巨大的发展契机,层出不穷的新媒
随着高铁的发展,处于高速移动环境下的无线通信用户也日益增加,导致高速移动通信面临严峻考验。正交频分复用(OFDM)作为多载波调制技术,将频域内信道划分成若干正交子信道,把高速串行信号调制到子信道并行低速传输,具有抗多径效应能力强、频谱资源利用率高等优势。但高铁传输时收发端相对位移加快,使OFDM子载波间不再严格正交,进而引起了子载波间干扰(ICI)。故寻找较好抑制ICI的信道估计成为当前研究热点。
随着数字视频技术的快速发展以及消费水平的不断提高,三维(Three Dimensional,3D)视频在生活中的应用越来越多,如3D影视,3D投影机,虚拟现实等。3D视频的数据量通常十分庞大,这是由于3D视频需要更多2D视频作为信息载体,同时还需要大量的辅助信息和距离信息。这无疑给3D视频的存储和传输带来非常巨大的挑战。为了在保证3D视频质量的同时,提高传输和压缩效率,国际3D视频编码扩展开发联合
显著性区域检测是近些年计算机视觉方向的研究热点,其目的是让计算机用算法模拟人类视觉注意机制,从图像/视频的大量数据中捕获人类感兴趣的区域。目前面向二维视觉显著区域检测的模型已经趋向成熟,但更接近人类视觉特性的三维视觉显著区域检测还有待深入。先前研究表明,深度信息可以丰富显著区域的空间结构,提高显著性检测准确率。深度图在获取或计算过程中可能会产生一些错误,这些错误会对检测结果造成负面影响,所以如何充
等离子体对流是高纬电离层中的重要特征,其中蕴含着太阳风向磁层-电离层系统能量传输的一系列重要信息。研究电离层等离子体对流在时间和空间上的演化规律,对我们深入理解磁层-电离层耦合机制,以及后续空间天气的建模与预测具有重要意义。本文基于多种深度学习相关算法对Super DARN雷达网探测到的北半球高时空分辨率的电离层对流数据进行建模,构建出了高纬电离层等离子体对流图预测模型,并采用独立时间段的测试数据
在工业生产流程中,自动化功能测试设备可以保证出厂产品的安全性和质量。在家用电器领域,产品的安全性和质量是家用电器的两个最重要的指标,日益严苛的产品安全质量指标对自动化功能测试设备提出了更高的要求。本课题设计了一款自动化功能测试设备,主要包括硬件信号采集板卡、信号激励卡以及工控机上配套的测试软件,其可以根据厂商提供的仕样书快速的搭建整体的测试环境,且具有性能优良,操作方便以及测试效率高等优点。本文首
在实际生活中,若智能体不具备自主规划的能力,其将会很难实现编队控制,而围捕控制作为编队控制的一种,需要智能体自主形成编队、规划路径。因此,对多智能体系统的路径规划跟踪与围捕控制问题进行深入研究不仅具有重要的理论意义,而且具有实际应用价值。本文主要研究了基于多智能体系统的多移动传感器路径规划与围捕控制问题,研究内容如下:(1)针对静止多目标的围捕控制问题,提出了一种融合最优次模式分配(Optimal
混沌是非线性系统中产生的伪随机现象,其丰富的动力学特性具有重要的研究价值。混沌理论已广泛应用于物理学、密码学、通信学以及经济学等领域。其中,基于混沌系统的图像加密算法研究属于混沌理论与密码学的交叉学科研究,已成为当下的研究热点。忆阻器是具有非线性特性的电路元件,可用于构建新型超混沌系统。基于忆阻器构建的超混沌系统有利于产生特殊的混沌信号,并表现出复杂的动力学特性,比如:超混沌特性、隐藏吸引子以及共
博弈理论是一种研究多参与者(可推广为多智能体)之间合作共赢与利益冲突并存关系的理论依据,随着计算机网络的发展,学者们将博弈论应用到计算机领域的许多实际问题中,如大数据云计算、无线网络等。在应对复杂计算机系统工程问题时,可运用博弈理论建模并分析相应的收益函数、损失函数、动作策略等寻求博弈模型的最优解(即纳什均衡)以获得系统的最大收益。近年来迅速发展的分布式博弈作为博弈论与分布式优化相结合的新研究领域
随着无线通信技术的高速发展,正交频分复用技术(Orthogonal Frequency Division Multiplexing,OFDM)凭着其高传输数据率、高频谱利用率以及优异的抗多径衰落性能,在通信领域中发挥着非常重要的作用。但OFDM系统中也存在着过高峰均功率比(Peak to Average Power Ratio,PAPR)的问题,过高的PAPR不仅导致信号发生畸变,增加系统成本,而