卷积神经网络的FPGA部署方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:string_lau
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着神经科学与计算机科学的推进,深度学习不仅在传统的图像、语音等信号处理领域不断刷新指标,而且逐渐开始被其他专业领域所关注,目前已在金融、医疗甚至社会学研究等多个行业都取得了突破性进展。随着深度学习算法被越来越多领域所接受和使用,专业领域的研究者迫切需要能对算法进行便捷地测试验证,并将成熟算法快速落地部署,形成生产力。但深度神经网络因其存储密集、计算密集等特点,加之应用场景对硬件资源的限制,对软、硬件开发的处理效率、功耗等都有着苛刻的要求,这与传统的PC开发方式有较大的不同,也给非IT方向的专业领域研究者带来了一定的开发门槛。同时,现在深度学习仍处于迅速发展之中,各领域的算法都在不停推陈出新,也导致相应的软硬件开发需要跟进迭代更改,为算法部署带来了较大的难度。本文设计了针对卷积神经网络的FPGA部署平台,能够在不更改硬件设计的情况下支持多种算法的部署,为专业领域研究者屏蔽复杂的软硬件开发,从而专注于算法研究。本文的FPGA硬件架构基于卷积神经网络的常用算子设计,并提供向上接口,通过自主设计的FPGA计算库能够方便的将算法进行编译部署在硬件上。该FPGA设计的峰值计算性能达到了129GOP/s,在性能、功耗和能效比上相比同类型设计达到了领先水平。
其他文献
图像在获取、压缩和传输过程中会被噪声污染而导致失真,不利于后续的高层次图像处理任务,因此图像去噪是图像预处理的关键步骤。自然图像的非局部自相似性先验是图像去噪领域最重要的先验之一,基于该先验的传统低秩近似去噪方法主要存在以下不足:一是标准核范数最小化通常会过度收缩每个奇异值,导致去噪后的图像过于平滑或模糊。二是现有方法只利用了图像的非局部自相似性,对整幅图像进行无差别的去噪处理,没有考虑到图像块的
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)可以实现对待测目标或场景高分辨的成像与探测,且不受气候和光照条件的影响。回波仿真(Raw Data Simulation,RDS)作为SAR相关研究的基础,它对SAR系统的设计、成像算法的验证和雷达参数的优化都至关重要。常规SAR-RDS大多基于理想地形假设条件,但实际场景通常比较复杂,剧烈的地形起伏将导致发射信号受到阻挡而产
学位
智慧法院建设促使现代化的大数据、人工智能等信息新技术与司法审判工作深度融合,不但可以极大提高审判效率,还让司法公正来得更高效、更有保障。按需标注的优质司法数据是智慧法院建设的数据基础。然而,裁判文书、法律条文等司法数据专业性强、形式多样、不同应用数据标注需求不一。众包标注方案难以保障标注质量。聘请经验丰富的司法专家进行专家标注可操作性差、成本高、效率低下。如何实现司法数据的高质量、高效标注成为智慧
学位
设备到设备(Device-to-Device,D2D)通信和非正交多址接入(Non-Orthogonal Multiple Access,NOMA)技术作为未来通信系统中缓解无线网络传输压力的有效手段,可以提升蜂窝网络中的频谱效率、能量效率以及用户连接数目,具有广阔的应用前景。因此,将NOMA技术应用到D2D通信中成为未来通信网络可预见的发展方向。D2D通信和NOMA技术的结合可以带来多方面的性能
学位
卫星信道具有较强的多径效应和群时延特性,在传输过程中会造成信号的符号间干扰,严重影响通信质量,通常可以采用自适应均衡的方法解决。盲均衡技术凭借其无须训练序列的优势,成为卫星通信中使用最广泛的均衡技术。高阶QAM调制因具有更高的频带利用率被广泛用于高速卫星通信中,但是随着QAM调制阶数与信息传输速率的提升,传统盲均衡算法效果不佳。因此研究具有更低稳态误差,更快收敛速率的新型盲均衡算法具有重要意义。并
学位
在现代生活中,人脸识别已遍布生活中的各个领域,如安防监控、移动支付等。尤其是随着物联网的飞速发展,在边缘端设备上部署人脸识别的需求正在快速增加。在移动设备或其它资源受限的小型边缘计算设备上,人脸识别算法的计算复杂度和计算效率将至关重要。然而,现有的基于深度学习的主流人脸识别算法往往需要大量的计算资源,基于传统机器学习的算法在无约束条件下面临识别率不足的技术挑战。因此,如何在计算资源有限的设备上部署
学位
我国国土辽阔,地形复杂多样,是世界上地质灾害最严重、受威胁人口最多的国家之一,地质灾害种类多,危害巨大,对人类生命财产以及地球环境保护会造成巨大的损失且不可挽救,另一方面,地质结构的微变形也会影响基础建设和建筑工程的安全性,如大坝、桥梁、隧道的变形量一旦超过安全界限,就可能发生重大灾害。因此对边坡进行形变监测就显得尤为重要,现阶段边坡形变监测的解决方案费时费力、灵活性低、无法实现全天候监测、成本昂
学位
第三代半导体材料碳化硅(Silicon Carbide,简称Si C)凭借其本身优越的特性,在功率器件的应用研究中逐渐成为研究热点,其主要特性具体表现为宽禁带、高热导率、高临界电场、高功率密度等等。而垂直双扩散金属氧化物半导体场效应晶体管(Vertical Double-Diffusion Metal-Oxide-Semiconductor Field-Effect Transistor,VDMO
学位
大规模多输入多输出(Multiple Input Multiple Output,MIMO)技术利用多径传播来提高系统吞吐量和能量效率,成为了第五代移动通信网络中最有前途的关键传输技术之一。但是在时分双工模式下,受限于信道相干时间,导频数量有限,不同小区的用户间导频复用产生的导频污染严重影响了大规模MIMO系统性能的发挥。因此,如何在有限的导频资源下设计可靠的导频污染抑制算法是研究的重点和难点。针
学位
机械旋转可重构反射阵天线是通过改变圆极化反射阵元的旋转角度,来调节阵元的反射信号相位,实现特定空间指向上的波束聚焦的一种新型可重构反射阵天线,具有结构简单、易于扩展、相位调节精度高等优点。但因其特殊的旋转结构,阵元的反射相位相对于传统的固定指向反射阵天线来说是可变的,具有一定的随机性,因此在使用之前需要对阵元的初始角度进行检测和补偿,以提高波束指向的精确度。本文提出了一种基于多目标位移测量雷达技术
学位