基于FPGA的深度卷积神经网络加速研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wwp8133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着深度学习掀起的新的机器学习热潮以及大数据时代的到来,卷积神经网络已广泛应用到图像分类、人脸识别、物体检测等多种应用领域。为了获得更强的特征学习与特征表达能力,卷积神经网络模型的深度正在不断加深,综合考虑到实时性、功耗和可扩展性,现有通用处理器CPU和GPU已无法较理想地满足要求。由于FPGA具有配置灵活、高度并行、低功耗和设计灵活等特点,本课题基于FPGA开发平台对深度卷积神经网络的加速展开研究。本课题主要从并行和流水两大方面深度挖掘深度卷积神经网络模型的潜在可加速特性,并提出利用相关调整参数重新调整深度卷积神经网络的计算结构,在计算层间形成了高效率的流水线,有效地减少了中间结果的存储空间需求,同时采用填充元素自动过滤策略、卷积计算二次集中累加策略等对突出计算瓶颈进行了有效缓解。实验数据显示,在本课题实验环境下,同一卷积神经网络模型基于FPGA的实现,在工作时钟频率为250MHz,DSP Blocks占用比为13%,对图像数据传输带宽仅为0.15Gbps的情况下,计算处理速度是通用CPU的18.42倍,而整体系统功耗却不到通用CPU芯片的30%。实验结果表明,按照本课题设计思想调整后的卷积神经网络计算结构,更有利于在FPGA上高效并行流水化实现,能大大提高运算处理速度并有效降低系统功耗。可在此基础之上,尝试对更大规模的深度卷积神经网络模型进行性能上的大幅度提升,以满足复杂应用场景下的低功耗、高实时性要求。
其他文献
国内外学者对中国参与联合国维和行动的研究,与中国军事外交的拓展、中国对维和事务的参与度密切相关。20世纪80—90年代,中国对维和的态度发生转变,从不参与到有限参与联合
前不久,组里组织了一次公开课活动,篇目是卡夫卡的短篇小说——《骑桶者》。小说写于1917年寒冷的一二月间,背景是第一次世界大战中奥匈帝国最艰苦的一个冬天的真实情况:缺煤。一
<正>满洲里市位于内蒙古自治区东北部,北纬49°,年平均气温-2℃,冬季寒冷时间长,夏季时间短,全年无霜期只有100天左右。本市种植胡萝卜已有几十年的历史,产品除主要向俄罗斯
敦煌本回鹘文《说心性经》尾跋和哲理诗中有齐苏雅一名,回鹤文写作fiisuya(也有的写作fiis6n或Cisuin).过去学术界一般将其视作《说心性经》的抄写者.随着敦煌莫高窟北区出土文
利用GC和GC-MS的分析方法,对祁连山七一冰川冰雪不溶微粒、冰尘和七一冰川流域表层土壤中的烷烃、脂肪酸、脂肪酸甲酯和长链酯、酮以及多环芳烃等生物标志化合物进行了分析,
当前我国能源的供需矛盾日益突出,资源环境承载的压力逐渐增大。结合建筑能源消耗量大的实际,为促进节能减排、改善生态环境,建设低碳环保型的绿色生态城市,本文就如何推动可
对完善中国民族学学科体系的一点看法詹承绪自党的十一届三中全会以来,中国民族学得到迅速的恢复和发展,取得了显著的成绩。但是,我们既要看到成绩,更要正视存在的不足与缺憾。在
一、采收。及时采收,清除杂质,要求菌盖直径为1.5厘米,柄长15厘米,菇体洁白完整。二、预煮。预煮液采用5%~7%的盐水,用柠檬酸将pH值调至4.5。煮沸后将菇体倒入并翻动,菇水比例为1:2,4分钟
Si作为海洋浮游植物优势组分-硅藻生长所必需的营养元素,在海岸生态系统研究中占据非常重要的地位。生物硅(Biogenic Silica)主要来源于硅藻、放射虫和海绵骨针等,生物硅的积