面向图像处理的神经网络加速器硬件设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:robert_xt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的飞速发展,基于深度学习算法的卷积神经网络CNN(Convolutional Neural Network,CNN)已经广泛应用于图像检测、识别和分类等任务。任务需要部署并执行高参数量、高计算量的卷积神经网络,但是传统的硬件无法满足神经网络计算时低功耗与高能效的需求,而基于专用集成电路ASIC(Application Specific Integrated Circuit,ASIC)的硬件也无法适应网络模型的灵活变化。针对以上问题,本文研究了一种灵活的面向图像处理的神经网络加速器。本文通过分析面向图像处理应用的卷积神经网络的计算模型,得到卷积神经网络的基本特征,如图像特征点间的相关性、权重共用和局部连接等。由这些基本特征作为硬件加速器设计的出发点,设计了以二维移位寄存器阵列为核心的加速器架构。面向图像处理应用设计了一套自定义指令集,对不同神经网络结构进行编程,使用编译器优化后装载至加速器中,达到软硬件协同设计与加速的目的。在处理卷积层时,利用数据循环移位结合权重广播的方法,由计算阵列并行计算同时输出多个结果,计算产生的部分和在阵列内部直接累加,减少数据的无效搬运,提高加速器的能量效率。在处理全连接层时,运用交换权重与特征图数据存储位置的策略,使加速器维持与处理卷积层时相同的计算方式和数据带宽,提高加速器计算阵列的利用效率,降低加速器的功耗。综上所述,本文通过设计自定义的指令集、高效的卷积层与全连接层计算方式提高了加速器的灵活性和能量效率。本文使用现场可编程门阵列FPGA(Field-Programmable Gate Array,FPGA)Zynq ZCU104搭建了硬件测试平台。测试的数据集使用Mini-Image Net,输入图像尺寸为224×224×3。分别测试了Alex Net和VGG-16两种卷积神经网络的图像分类任务。测试Alex Net时,加速器的性能为26.49GOPS(Giga Operations Per Second,GOPS),功耗为13.79W。测试VGG-16时,加速器的性能为33.38GOPS,功耗为14.02W。
其他文献
随着现代科学技术的发展,天线的使用场景越来越复杂。由于对天线的性能出现了各方面的需求,于是各种新颖的天线技术被提出。而智能天线中的方向回溯天线是研究热点之一,它可以在不知道来波方向的情况下,使得回传信号自动指向来波方向。方向回溯天线一般采用相位共轭原理实现,由于具备了高速跟踪能力和性价比高等优点,在信息通讯与雷达等应用领域中被普遍采用。尽管方向回溯天线具有这些优点,可是目前的方向回溯阵列的实现,大
学位
在我国经济快速发展的背景下,企业国际化成为了许多中国企业快速扩张的最佳选择之一。早期关于企业国际化的论文大量阐述了企业在国际化过程中可能获得的利益,然而在现实中对企业国际化的检验结果却喜忧参半。中国企业的国际化进入纵深阶段,企业是否能从宏观层面选择一种合适的国际化扩张战略变得尤为重要。与西方发达国家不同,我国企业的国际化进程“起步晚”且经验有限。在国家大力鼓励“走出去”的初期,受政策激励与补贴的影
学位
随着经济快速发展,城市化进程不断加快,城市道路网络的规模也不断增大。与此同时,经济的发展伴随着居民车辆保有量的提高,这便使得交通拥堵问题成为了当今社会我们面临的一项巨大的挑战。路径规划技术是交通系统中调节车辆通行状况的主要手段。系统科学认为结构决定了功能,因此,充分认知道路网络的结构特征对于实行更加科学有效的路径规划有着重要的理论和现实意义。本文利用复杂网络理论对城市道路网络结构进行了多方面的研究
学位
软土作为公路建设中经常出现的不良地质,其较小的抗变形能力及承载强度极易对公路行车稳定性造成一定威胁。分析软土路基的沉降,提出相应的处治措施,以确保公路使用耐久性。文章依托新疆某高速公路软土填方路基进行ANSYS有限元的变形分析,并且对软土路基经土工格栅+水泥搅拌桩复合加固处理后的变形效果进行评估。结果表明,加固后的软土路基顶部、底部的竖向与水平向变形得到了明显限制;15年工后沉降最大值4.8 cm
期刊
近年来,数字信息通信相关技术不断发展,数字图像的存储与传输已然成为常态,其安全问题成为关注重点。图像具备数据信息量大、图像相关性强等特点,使得文本加密方法用于图像加密后安全性和效率得不到保障。研究者就需要根据图像特性构建具有针对性的加密算法。进化算法具有良好的鲁棒性和优化特性,用于图像加密能够进化得到高安全性能的加密图像或者最佳的密钥。细胞自动机拥有丰富的运算规则和复杂的非线性动力学特征而被广泛应
学位
在世界分工加深的大背景下,一国的制造业发展水平决定了其在全球分工中的地位,技术能力差异正是造成各国间在世界价值链中地位差异的主要决定因素。所以,我国制造业亟需进行适宜的技术创新路径选择,通过合理分配有限的技术创新资源,最大程度地促进我国制造业的创新发展,提升科技创新能力,进而实现我国制造业由高速发展阶段走向高质量发展阶段。本文基于国际贸易和新型国际分工的背景,深入研究为实现制造业高质量发展所适宜的
学位
神经网络是人工智能机器学习领域的一个重要分支。神经网络通过学习获得“经验”,能够解决并简化很多带有复杂计算的问题,例如图像识别、自然语言处理、机器翻译等问题。在通信领域同样有很多带有复杂计算的问题,或者希望能够简化复杂计算的问题,例如调制方式识别、信道编译码等问题。因此本文旨在研究神经网络与通信系统结合,利用神经网络去解决通信中的问题。本文所涉及的主要研究内容分为三个部分,分别是基于神经网络的调制
学位
产业结构可以用来衡量一个国家和地区的经济发展水平。因此,许多国家和地区都纷纷对自身的产业结构进行调整,把促进产业结构的升级作为目标。从总体上来看,我国经济发展的趋势良好,但仍然存在着困难,例如如何加快产业结构升级从而促进我国经济进一步发展。当前,我国不断扩大对外开放的程度,对外直接投资对我国的经济社会以及各方面的发展作用日益突出,对外直接投资可以通过引进先进的技术和人才,传统产业转移,化解过剩产能
学位
随着无线通信技术的快速发展,移动通信用户的急剧增长,频谱资源日益紧张,具有自动方向追踪能力的低成本、高增益、紧凑型的天线系统备受关注。同时为了保证天线系统在多种场景下的高适用性,如增大系统雷达散射截面(RCS)的目标探测技术、降低系统RCS的隐身技术等,基于方向回溯天线实现系统的RCS参数可调也成为了研究的重点。针对传统的方向回溯系统包括角反射器无法调制后向散射信号、Van Atta阵天线效率太低
学位
随着社会的不断发展,土木、机械和航空航天领域的各种大型工程结构已经无处不在,为了确保这些结构和材料的完整性,越来越多的结构健康监测(Structural Health Monitoring,SHM)方面的需求被提出,以保障安全并减少维护成本和时间。超声导波(特别是Lamb波)检测技术作为应用最为广泛的SHM方法之一,其中超声导波传感器是信号探测的关键器件,超声导波检测的常用传感器包括压电式、电磁式
学位