基于FPGA的卷积神经网络训练加速器设计

来源 :南京大学学报(自然科学) | 被引量 : 0次 | 上传用户:real_dolia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来卷积神经网络在图像分类、图像分割等任务中应用广泛.针对基于FPGA(Field Programmable Gate Array)的卷积神经网络训练加速器中存在的权重梯度计算效率低和加法器占用资源多的问题,设计一款高性能的卷积神经网络训练加速器.首先提出一种卷积单引擎架构,在推理卷积硬件架构的基础上增加额外的自累加单元,可兼容卷积层的正向传播与反向传播(误差反向传递和权重梯度计算),提高加速器的复用能力,同时提升权重梯度计算的效率;然后提出一种适配卷积核内加法树与自累加单元的新型加法树设计,进一步节约计算资源;最后在Xilinx Zynq xc7z045平台上实现了所提出的训练加速器,并基于CIFAR-10数据集训练VGG-like(Visual Geometry Group)网络模型.实验结果表明,在200 MHz的时钟频率下,支持8位定点的训练加速器可以达到64.6 GOPS(Giga Operations per Second)的平均性能,是 Intel Xeon E5-2630 v4 CPU(Central Processing Unit)训练平台的9.36倍,能效是 NVIDIA Tesla K40C GPU(Graphics Processing Unit)训练平台的17.96倍.与已有的FPGA加速器相比,提出的加速器在处理性能和存储资源使用效率上具有优势.
其他文献
自二次坑是背景二次撞击坑中的一类,是撞击过程中近垂直溅射的物质回落至母坑的连续溅射沉积物上形成的二次坑.二次坑的概念于20世纪60年代首次提出于,直至近十年被发现和证实,研究自二次坑对完善撞击坑统计定年方法和撞击过程的物理机理具有重要意义.近年来,深空探测获取了多个天体的高分辨率遥感数据,前人已在月球、水星等天体表面发现了自二次坑.但是,自二次坑的详细成因机制以及自二次坑对撞击坑统计定年方法的具体影响依然存在大量未知.系统综述了自二次坑的发现和研究历史,介绍了自二次坑与其他不同类型二次坑的区别;重点梳理了
GRV 050202是中国南极科考队在南极格罗夫山地区发现的一块普通球粒陨石,为了了解其性质特征,对该陨石光薄片进行了光学显微镜、扫描电子显微镜观察及电子探针分析.结果显示,该陨石由非平衡区域和平衡区域组成,非平衡区域岩石类型为3.6型,平衡区域为5型,两区域均为L群,该陨石冲击变质程度和风化等级分别为S1和W1.此外,该陨石非平衡区域包含有混染外来物质的表土角砾及普通球粒陨石中少见的两个富钙铝难熔包体(Calcium-Aluminum Refractory Inclusions,CAIs)和一个蠕虫状橄
以金属锂作为负极的固态锂-氧气电池由于超高的比能量和宽操作温度而成为当前国际研究的热点,但是金属锂的高反应活性使基于金属锂负极的固态锂金属电池难以在高温下稳定地工作.用高离子导体的三元碱金属锂盐作为金属锂(Li)负极与固态电解质(Li1.5Al0.5Ge1.5P3O12,LAGP)之间的人工界面层,改善Li/LAGP之间的界面接触,降低其界面阻抗,提高界面稳定性.基于此制备的固态锂-氧气电池在150℃可以释放出1.58 mAh.cm-2的容量,对应库伦效率接近100%,在定容0.1 mAh·cm-2时,可
次级源和误差传声器的布放是决定有源噪声控制系统降噪性能的重要因素.针对嵌入在管道中的紧凑式有源噪声控制系统,建立了半无限长矩形管道的声传输解析模型,系统地分析了误差传声器和次级源布放位置对低频声辐射控制效果的影响.针对截面为正方形的管道,提出了一种多传声器的误差传感策略,仿真和实验结果表明,使用该策略可有效提升紧凑式有源降噪系统在管道截止频率以下的降噪效果.
火山活动是天体内部热活动的表现,火山活动的形式和持续时间是探索行星环境和宜居性演化的重要方面.与内太阳系的其他天体一样,水星表面经历了大规模和长时期的火山活动,但是水星上的火山地貌、喷发机制、持续时间,以及火成岩的物质组成等特点和其他类地天体明显不同.水星上的火山活动主要发生在太阳系形成之初的10亿年内,溢流性火山活动形成的坑间平原和平坦平原在全球分布,是水星表面分布面积最大的火山物质.随着内部逐渐冷却,水星自约38亿年前后进入了全球收缩的热状态,岩石圈内的压应力阻碍岩浆上涌,大规模溢流性火山活动快速停止
随着汽车行业的高速发展,汽车音响声品质,如音质感与空间感的研究与应用成为汽车声学系统的研究热点.提出一种适用于汽车音响系统的多通道均衡和串扰消除的优化系统.基于车内多测点的冲激响应,设计了优化系统,分别用于改善汽车音响系统的音质和空间感知效果.该音响系统中,频域解卷积方法用于设计多通道逆滤波器,以高质量汽车音响系统的典型频率响应作为目标频率响应.通过多个客观指标验证分析了该系统的有效性,并通过主观评价实验验证了该系统在主观听感上的性能提升.
我国月球与深空探测规划中都有关于样品采集返回的任务,对这些地外返回样品的研究将极大地促进我国行星科学研究的发展.保证采集回的地外样品原始特征不被改变对于后续的科学研究至关重要.地外样品的储存与管理是一个复杂的系统工程.回顾并对比了美国、日本与欧洲(规划中)地外样品储存与管理设施的整体设计、惰性环境控制、设施材料选择、污染管理与清洁等方面的工作.基于已有设施的优缺点,进一步探讨了地外样品保管的新趋势与新挑战,以期对未来地外样品管理与储存工作提供借鉴和参考.
2020年新冠疫情期间,政府实施了强有力的封控措施,使人为排放降低显著,这也为研究更强减排力度下空气质量的响应提供了一次独特天然实验.为研究疫情减排期间广东省空气质量变化情况及其驱动因素,将广东分为珠三角、粤东和粤西北三个地区,利用观测与再分析资料等数据分区分析了疫情期间广东省空气质量变化情况及其驱动因素.结果显示,和2020年春节前比较,2020年春节后(即疫情期间)的气象场要素更不利于臭氧(O3)的光化学生成.和2019年节后比较,疫情期间广东省人为排放低于往年同期,但O3浓度并未随前体物浓度的下降而
近年来,伴随着人工智能的发展及法院裁判文书的公开化,“智慧司法”、案例推荐成为热点问题.针对案例推荐中存在的推荐准确性差、传统知识图谱向量化表示精度不高等问题,提出基于知识图谱的案件推荐(Knowledge Graph based Case Recommendation,KGCR)模型.该模型以知识图谱为辅助信息,利用文本分类和信息抽取技术构建面向刑事案例的知识图谱,针对当事人的陈词供述,利用知识表示学习求解相似的案件,进一步实现法条推荐.针对TransH算法的负采样问题进行改进,提出FU-TransH算
从脑电信号中精确提取和运动想象相关的特征是运动意图识别的难点之一.为了准确识别运动意图,提出一种可以同步提取运动想象信号时间、频率和空间特征的卷积神经网络算法,称为时-频-空卷积神经网络(Time-Frequency-Spatial Convolutional Neural Networks,TFSCNN).TFSCNN利用3D卷积提取运动想象信号的频率特征,深度可分离卷积提取空间和时间特征,最后使用时间卷积神经网络进一步提取时间特征.利用公开数据集BCI Competition Ⅳ dataset 2b