基于FPGA的卷积神经网络软硬件协同设计与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:AdamMYS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自人工智能发展以来,深度学习算法特别是卷积神经网络CNN在计算、资源、功耗和成本均受限的嵌入式系统上的设计一直是一个比较热门的研究领域。CNN作为一种高性能的人工智能算法,可以广泛应用于人脸识别、行人检测和故障诊断等多个领域。它在嵌入式系统中的部署更是加速了这些应用的落地,使它们脱离服务器的束缚,真正服务于移动端和边缘端市场,具备很高的实用价值。CNN在嵌入式系统中的部署不仅涉及到了硬件设计更涉及到了软件设计,目前大多数研究者主要关注的是基于现场可编程逻辑门阵列FPGA的CNN硬件加速器设计,从系统级的角度去研究基于FPGA的卷积神经网络软硬件协同设计较少。此外,如果过度执着于追求足够快的硬件CNN加速器而忽略一些受限软件的性能,那么很可能会导致系统软硬件处理时间的不平衡,进而降低硬件CNN加速给系统带来的收益,造成了硬件资源的浪费。为了解决上述问题,本文提出了一种面向CNN的嵌入式系统。首先,针对嵌入式系统资源受限和CNN资源占用量大的矛盾,结合CNN的结构相似性,提出了基于FPGA的CNN硬件复用设计方法,以较低的FPGA硬件资源在嵌入式平台上部署CNN模型。然后,基于硬件复用提出了启发式软硬件执行时间平衡设计方法。该方法将系统软硬件执行时间融入进CNN硬件设计中,通过优化系统软件和CNN硬件的并行度来达到系统软硬件执行时间平衡的目标。最后,提出了一种软硬件协同设计方法设计并实现了面向CNN的嵌入式系统。该方法利用模块化思想对系统架构进行抽象,并结合抽象后各个模块的特点对系统进行软硬件划分,随后使用提出的硬件复用和软硬件执行时间平衡设计方法对划分后的模块展开软硬件协同设计,同时结合有效的软硬件数据交互和控制协议,在保证准确率和速度的前提下使系统节省了硬件资源,提升了CNN硬件加速收益。实验结果表明,本文设计的面向CNN的嵌入式系统在保证准确率和速度的前提下达到了接近1:1的软硬件执行时间比,而功耗仅为2.4W左右。相比于同类型的研究工作,系统达到了95%甚至99%的设备利用率,提升了28%~46%,且将能量效率从10帧/W以下提升到了10帧/W以上。更重要的是,硬件复用设计方法节省了系统中宝贵的FPGA资源。软硬件执行时间平衡设计方法提升了系统中软硬件设备的利用率,大大提升了CNN硬件加速的收益。
其他文献
燕麦属(Avena L)隶属于禾本科(Poaceae),早熟禾亚科(Pooideae),燕麦族(Aveneae),全世界约有30个种。由4种基因组组成AA、CC、AABB、CCCC、AACC/CCDD、AACCDD 6种基因类型。由于燕麦基因组庞大复杂,种间关系不清晰,各染色体间同源关系不明,无法对各染色体进行识别,基于此,本研究利用简单重复序列探针,系统的标记了二倍体、四倍体、六倍体燕麦染色体,
毛囊(hair follicle,HF)是皮肤的重要附属器官,具有保护皮肤、分泌皮脂、调节体温、传递信息等生物学功能。毛囊病变和衰老会引起毛发周期失调,导致脱发等毛发疾病,可严重影响患者的健康、美观和生活质量。因此,对脱发等毛囊疾病的研究及治疗具有十分重要的意义。火针属于中医外治疗法,具有局部刺激、经络传导、整体调节等特点,已广泛应用于临床治疗各类疾病。运用火针对毛发疾病进行治疗,主要是通过针刺体
核桃(Juglans regia L.)是我国重要的“木本粮油”生态树种,被称为“21世纪的超级食品”,其丰富的营养成分对人类健康有益,具有良好的经济价值和社会效益。随着其种植面积的不断扩大,核桃的病害日趋严重,其中叶斑病是主要病害之一。相关病害的发展目前已经成为核桃产业发展面临的严峻问题。本研究通过高通量测序技术对健康叶与病症叶间微生物种群的物种多样性、丰富度、动态变化规律等进行了细致的分析,找
能源作为现代社会发展的支柱型产业,具有举足轻重的地位,其中氢能以燃烧热值高、产物无污染、资源丰富的优势,成为21世纪最受欢迎的清洁高效能源。目前,氢能的高效利用主要依靠燃料电池(FCs)装置,FCs阴极和阳极的主要反应分别为氧还原反应(ORR)和氢氧化反应(HOR)。然而ORR/HOR对Pt等贵金属催化剂的重度依赖限制了燃料电池的商业化发展。因此,寻找低成本高活性的非贵金属催化剂十分必要。过渡金属
良性特发性位置性眩晕(Benign Paroxysmal Positional Vertigo,BPPV)是临床上一种常见的周围性前庭疾病,其多发病于中老年人。BPPV的主要病理表现为前庭末梢器官病变,粘附在内耳球囊和椭圆囊斑上的碳酸钙盐结晶脱落。通常,BPPV患者头部位置改变时会产生强烈眩晕,同时出现眼颤症状。一直以来,关于BPPV的研究多从其发病诱因、诊断标准、治疗方法方面展开。然而长期外围输
草酸二甲酯(DMO)加氢制乙醇酸甲酯(MG)(DMO-to-MG)不仅有利于促进石化产业原料多元化,更有助于填补聚乙醇酸(PGA)市场空缺。磷化镍催化剂以其高MG选择性、效果稳定以及价格低廉的特点在DMO-to-MG逐步受到关注,但该催化体系目前主要存在以下问题:DMO无法深度转化或/和载体的酸性造成副反应的发生。因此,本文围绕温和条件下高效DMO-to-MG反应过程的构建,以Ni3P为活性组分、
级联生物催化反应是一类重要的化学转化,在生物信号转导和代谢途径中发挥重要作用。在生物系统中,复杂的生物催化级联过程发生在不同的细胞膜分隔的细胞器中,以防止出现干扰,从而产生效率极高的生物产品。在自然系统中模拟多酶催化级联反应,在受限结构中的空间组织在新兴的系统化学领域中得到越来越多的关注。为此,研究人员开发了多种生物微反应器,但它们仍难以满足模拟细胞反应途径的复杂性。在这项工作中,我们开发了金属有
茶树油作为植物精油,具有天然的抗菌、抗炎、抗病毒、抗肿瘤、抗氧化及提高机体免疫力等功效。丰岩乌骨鸡作为地方鸡种,更需要科学的养殖来促进当地经济的发展。所以本试验通过在日粮中添加茶树油,研究其对丰岩乌骨鸡雏鸡生长性能、免疫功能和肠道发育的影响,以期为茶树油在丰岩乌骨鸡日粮中的添加提供试验依据。本试验选用3日龄健康丰岩乌骨鸡1650只,随机分为5组。第一组为空白组,饲喂基础日粮;第二组为阳性组,在基础
Helmholtz方程是一个描述频域中波传播的偏微分方程。该方程在声学、电磁学和地震学等相关研究领域里有着广泛的应用。时谐情况下的声波传播,特定情况下的电磁波的散射,以及地震波扩散等过程在一定条件下都能够简化为该模型。因此Helmholtz方程的高效数值求解方法一直都是研究的热点。但是由于该模型具有一些特殊的性质,在对它进行模拟逼近时许多数值格式效果不佳。其主要原因是该模型往往建立在无界区域上,且
近年来,压缩感知(Compressed sensing)在信号处理、数学理论、统计学、计算机学科等领域得到了广泛关注。压缩感知中的稀疏信号重建是一类优化问题。原始-对偶牛顿优化算法是求解这类问题的一类重要方法。由于该方法需要用到二阶导数的信息,因此是二阶优化算法。二阶优化算法在收敛速度等许多方面具有优势,但也存在一个明显的缺点,即每步更新都需要求解一个线性方程组。本文利用循环矩阵构造了几种具有快速