基于神经网络加速器的图像识别系统设计

来源 :湖南大学 | 被引量 : 0次 | 上传用户:windplume
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉在工业物联网领域发挥着不可忽视的作用。计算机视觉中最关键部分是图像采集和图像识别,深度卷积神经网络算法由于其较高的识别精度成为图像识别算法的首选。在实际应用中通常使用GPU对神经网络算法进行加速,但消耗了较大的功耗,因而限制了其在资源和功耗有限的移动嵌入式平台中的应用。本文利用全可编程SoC平台对基于卷积神经网络加速器的图像识别系统进行设计,该SoC为ARM+FPGA架构平台,具有高性能、低功耗和可编程逻辑资源丰富等特点。本文中图像识别系统主要包括图像采集系统和CNN加速器,图像采集系统实现视频图像数据的采集与存储,采集帧率最大可达30fps。CNN加速器通过加速CNN算法的前向推测过程来实现图像的快速识别。由于CNN算法具有高计算量和高访存量的特点,因此提高运算的并行度和数据传输带宽是加速器设计的关键所在。基于上述思路,本文设计了完整的CNN加速器,主要包括专用计算单元、指令控制单元、存储控制模块、扩展运算单元等。文中设计了32x7定点计算阵列与特定数据通路,提高加速器的运算速度和内存带宽。针对权重压缩和网络的稀疏性,本文提出了一种特殊存储方式,并设计权重地址生成模块对压缩后的权重进行解压缩。针对步长大于1时输入数据复用低的缺点,本文提出一种输入数据滑动窗口步长变换为1的方法,该方案能最大程度地利用硬件并行性和数据通路复用,可减小计算量巨大的输入层运算时间和功耗消耗。本文最后采用Xilinx Zynq-706开发板对图像识别系统进行实现与验证,并利用训练好的图片分类应用,在100Mhz的时钟频率下,计算速度可达30fps,功耗仅为2.371W。
其他文献
都江堰世界遗产是世界水利工程的杰出"代表",但通过孤立地保护渠首工程、历史建筑、历史街巷等来诠释都江堰的全部遗产价值是不全面的。文章首先基于文化景观视角,提出以都江
在“双一流”高校建设中,科研经费使用效率的提升对于提高高校科技创新能力、促进我国科技进步具有重要意义。文章将江苏省15所“双一流”高校作为研究对象,采用CCR、BCC及超
用HYSYS对MDEA法脱碳工艺进行软件模拟,并通过对关键参数进行分析,得出了来气流量越小、来气碳含量越低、吸收塔温度越高,脱碳效果越佳的结论。并通过联合这三个自变量,考虑
背景介绍1934年5月23日,《红色中华》第192期第2版以整版登了粤赣通讯《安远的白色恐怖与群众斗争》,报道白军仅在安远县城即屠杀400多人。文章配发一组《国民党法西斯蒂的白
定格动画是世界动画艺术中一种重要的形式,在我国很多早期的动画作品中,多采用的是这种制作形式,在动画行业不断发展的过程中,定格动画慢慢与高科技技术结合,创造出了较大的
随着知识经济时代的到来,高校的科技管理工作面临许多新的机遇和挑战。如何实现高校科研管理工作的创新,促进科学技术和整个社会的和谐发展,是高校科研管理工作人员应予以关注的
案例背景:K公司是一家以出口纺织品为主的公司,近几年来,中国鼓励有能力的企业向外发展,K公司利用中国优惠政策,及时调整市场战略,招兵买马,甚至不惜重金聘请国际人才,以扩张企业的规
目的观察过氧化物酶体增生物激活受体γ(PPARγ)激动剂罗格列酮(RSG)和结缔组织生长因子单克隆抗体(CTGFmAb)对人胃癌细胞系BGC823生长、侵袭和迁移的影响,初步探讨PPARγ、C
语文课程是学生学习运用语言文字的课程,要将“学习语言文字运用”这一核心目标落实到具体的教学过程中,每位教师有必要回答并解决好“要把学生带到哪里去”“怎样把学生带到
油桐(Veronica fordii(Hemsl.)Airy Shaw)是大戟科油桐属中的一种落叶乔木,原生长于中国,是我国重要的木本油料植物。油桐全株有毒,有消食、利水、化痰、杀虫、解毒消肿等作