基于Zynq的深度学习图像分类识别系统的设计

来源 :广东工业大学 | 被引量 : 11次 | 上传用户:qwer_xxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前卷积神经网络应用已经在CPU或GPU的机器上实现,是以牺牲性能和能耗为代价。因此,研究热点转向如何高性能低功耗地来实现深度学习相关算法。近年来越来越多嵌入式机器视觉相关应用(实时图像和视频处理)层出不穷,但传统的嵌入式处理器计算能力十分有限,很多场景应用已经不能满足实时处理的要求。在分析当前嵌入式的处理器来实现基于深度学习相关算法的图像处理的基础上,最终采用一种ARM+FPAG的设计方法进行基于深度学习相关算法的图像处理,可以充分发挥卷积神经网络中的并行特性,并且具有实时性强、低功耗的优点。具体在Xilinx Zynq-7000架构基础上,通过进行合理的软硬件设计,最终搭建一个图像分类系统平台。论文中主要的工作有:深度学习对于抽象问题的认知具有显著成效,分析得出深度学习网络中的卷积神经网络的基本算法能够很好地运用在图像处理上,并在此基础上分析了当前卷积神经网络算法中计算部分进行软硬件设计的方法和技术手段。在了解基于Zynq So C硬件架构的图像分类系统框架及Zynq-7000开发平台的ARM部分的开发特性基础上,进行了图像分类系统的运行环境设计,根据系统的启动方式对Linux嵌入式操作系统进行了移植,从中涉及了U-boot、设备树文件和文件系统的设计。提出了一种同步数据流IO模型实现卷积神经网络在FPGA上部署的设计方案,优点是用最小的内存占用实现最佳的性能。借助Vivado HLS开发工具对Zynq的FPGA部分进行IP设计。同时根据数据流传输体系结构,将32位浮点和定点算法进行比较,分别设计卷积神经网络中各层IP。基于Zynq-7000平台对图像分类识别系统进行软硬协同设计,给出了软硬件开发流程。对软件部分Linux系统下硬件驱动程序进行了编写,同时提供编程接口以服务于上层用户。加速器验证了CIFAR-10原型显示出高达43倍的加速度,同时保持73.7%的分类精度和2.063W的低功耗,证实了Zynq-7000平台能较好地实现图像分类识别,在嵌入式图像应用上具有很高的实时性。
其他文献
根据1898—1992年青岛年平均温度和降水资料,分析了青岛95年来的气候变化,指出年平均气温有明显变暖趋势,而降水量变化不显著。分析了年平均温度和降水的气候阶段,还采用信噪比方法检验了95年
目的 观察阻塞性睡眠呼吸暂停低通气综合征 ( OSAHS) 患者减肥治疗疗效. 方法 97例OSAHS中男82例, 女15例, 年龄31~89 (63±19) 岁. 通过家访式调查, 观察减肥前后相关指标.
中国科学院知识创新工程重大项目是指以解决我国经济发展、国家安全和社会可持续发展的重大战略性科技问题为主要目标,能充分发挥我院综合优势、广泛吸纳社会资源、跨所跨学
<正>1994年神奇的一年,经典电影如雨后春笋般涌现。1.《阿甘正传》(1994)地区:美国导演:罗伯特·泽米吉斯主演:汤姆·汉克斯罗宾·怀特·潘加里·西尼斯莎莉·菲尔德海利·乔
弗朗兹&#183;P.舒伯特(1797—1828)是奥地利最著名的作曲家之一,一生作有大量室内乐、钢琴独奏曲及交响曲、歌剧等。舒伯特音乐中最为广泛流传的是他的近600首歌曲的创作,他的歌曲
歌剧《雷雨》与“上海之春”国际音乐节特别有缘。2001年,献演于“上海之春”的音乐会版歌剧《雷雨》,不仅荣获音乐创作一等奖,更赢得各方如潮的好评。时隔5年,2006年5月5日,《雷
2007年10月20日,第九届中国上海国际艺术节“谭盾与郭文景&#183;音乐大师双人谈”在上海举行,谭盾、郭文景两位音乐大师围绕“‘死亡与再生’——关于歌剧中国和中国歌剧的未来
整个电力系统对用户的供电能力和供电质量均通过电网来体现,因而电网的供电指标实际上是整个电力系统结构和运行特性的集中反映。随着国民经济的发展,科学技术的进步及人民生
她被世界誉为“中国夜莺”,她以歌唱艺术与技巧的完美结合唱遍全球,她是唯一能唱满整场音乐会的抒情花腔女高音,她就是迪里拜尔。她是中国第一位女指挥家,她是中国登上国际歌剧指