基于Xilinx Zynq平台的卷积神经网络模型研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:dangerwind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着神经网络技术的迅猛发展,卷积神经网络正逐渐成为图像处理领域的首选算法,但卷积神经网络庞大的计算量使得其难以在各类移动应用场景中大规模推广使用。因此,利用适用于并行计算的FPGA来实现卷积神经网络已成为热点。但FPGA虽适合设计并行计算,却并不适合设计通用处理器可轻易实现的各类业务逻辑,因此很多应用采取的方案是同时使用FPGA和微处理器进行设计,这种设计的缺点是增加了开发成本,且不利于提升系统性能。为解决这一问题,Xilinx公司率先推出了Zynq系列平台,该平台是行业内首个将FPGA和微处理器集成进一个芯片中的平台,可轻松解决传统的双芯片设计带来的通信成本高、开发成本高等问题,适合需要进行高性能计算的移动应用场景。本研究基于Xilinx Zynq平台,设计了一种易于拓展的卷积神经网络计算模型。本文首先介绍了卷积神经网络和Xilinx Zynq平台,并对卷积神经网络在FPGA上实现硬件加速中的关键问题进行了分析。然后对本研究中基于Xilinx Zynq平台设计的卷积神经网络计算模型进行了详细的介绍,并针对计算模型的拓展给出了若干优化设计。最后,本文对本研究设计的计算模型进行了实验并对其可拓展性进行了分析,实验和分析表明本计算模型具有较好的计算性能,且具有良好的拓展性。本研究的计算模型设计了一个乘加器计算阵列来实现高性能并行计算,该阵列对卷积神经网络进行逐层加速。此外,还设计了流计算层模块,将若干会影响计算阵列效率的输入通道数和输出通道数较少的层固化到FPGA中对输入数据进行流式计算。流计算层模块不需要对权重数据以及计算的中间数据在外部内存上进行缓存,因此不会产生与外部内存的数据传输,有利于提高计算模型整体的计算效率和部署的灵活性。在Xilinx Zynq 7020平台上,16位定点数的计算模型在100MHz运行频率下实现了11.23帧每秒的检测速度,计算性能达到了30.37 GOP/s。对比通用处理器i5-8250U,该计算模型的计算性能是通用处理器的4.88倍,能耗比是其33.29倍。对比同类型的其他研究,本计算模型同样具有一定的优势。此外,本计算模型在多个方面均具有良好的可拓展性,支持动态地获取和配置网络结构,能够在运行时调整计算模型中的网络结构,且可以实现同时对多个网络进行加速计算。
其他文献
以窄轨矿石敞车为研究对象,在线路静态扭曲减载试验和线路动力学试验的基础上,从车辆系统固有频率、轮重减载率、车体加速度功率谱密度以及特定线路下弹簧变形量等方面对仿真
在稀土掺杂纳米复合材料的光学应用中,吸收和散射损耗最小化是获得高透明度的复合材料的关键。然而,不同的形状,尺寸和复合物导致颗粒的散射性质变得难以解释。因此,寻找一种制备具有纳米晶体的透明纳米复合材料的策略值得探索。我们通过瑞利散射理论提供简单的近似来计算透明度,解释可见光区域中的散射。这些光学结果表明,纳米晶体具有用于制造高透明度的功能性发光光学复合材料的通用策略。我们优化了一种新颖的方法来合成具
近年来计量基准技术的发展趋势之一是以客观物理效应替代实物标准器,以提升基准的可复现性及精度和降低实物标准器逐级传递引入的累积误差。在辐射度学领域中,这一发展趋势体
发光材料是一类吸收高能粒子(中子)或射线(γ射线)后能够发光的材料,在辐射探测领域发挥着十分重要的作用,通常在应用中将其加工成晶体,称为闪烁晶体[1]。稀土离子因其独特的电子结构而具有丰富的光学跃迁能级,被称为发光材料的宝库,已被广泛应用于荧光晶体、荧光玻璃、荧光陶瓷、闪烁晶体、闪烁玻璃和闪烁陶瓷等闪烁光功能材料中。但是由于稀土价格较高,所以人们就将含稀土的组分部分改成其他非稀土元素,并且具有同样
Customers will enjoy exhilarating sporting action,exciting moments when they fly with Singapore Airlines during the 2008 Summer Olympic Games in Beijing. To sat
期刊
用户的保留和满意度是电信服务提供商获得出色财务成功的主要目标。随着电信市场上公司之间的强烈竞争,在乍得电信服务提供商已经意识到客户满意度的价值和重要性,并它们正试
针对与上海交通大学共同研制的ZY-1型自主水下航行器,本实验室承担了其动力推进装置设计与优化任务。本文首先综合水动力特性和新型后置推进器的设计,分析此新型AUV后置X型推