【摘 要】
:
近年来,深度神经网络受到了越来越多的关注,其中卷积神经网络能够在时间与空间上提供平移不变性,它在语音识别方面有较好的应用。目前卷积神经网络主要在CPU或GPU上进行实现,
论文部分内容阅读
近年来,深度神经网络受到了越来越多的关注,其中卷积神经网络能够在时间与空间上提供平移不变性,它在语音识别方面有较好的应用。目前卷积神经网络主要在CPU或GPU上进行实现,但是无法同时达到高计算速度与低功耗的双重要求;而由于FPGA计算资源丰富、计算并行度高,功耗较低,并且兼具便携性,使用FPGA进行卷积神经网络的加速引起了越来越多研究人员的关注。本文针对应用于语音识别中声学模型的一个7层的卷积神经网络,将该网络的前馈计算过程进行定制化实现。为了减少FPGA内存储资源的消耗、降低带宽要求,在数据量化方面整体采用16位定点数据进行计算。在硬件实现方面,为了提高系统的吞吐率,采用流水线结构,并且提高了系统的并行度。通过分析网络内的并行性,在水平方向复用卷积核参数,在对角线方向复用输入数据进行卷积层的计算,并通过资源复用优化全连接层,节省了硬件资源,通过PCIe实现PC与FPGA的数据交互。最终本文实现的卷积神经网络在Intel Arria 10 FPGA上进行了验证。在150MHz的系统时钟下,达到了159.5GOPS的计算速度,其功耗为15.43W,能效比为240.7f/s/W,相比于Tesla K40 GPU达到了2倍的加速比与8倍的能效比。
其他文献
近年来,毫米波技术发展的如火如荼,利用毫米波可穿透织物的特性,毫米波成像系统可用来探测人体衣物下隐匿的违禁物品,可广泛应用于机场安检和海岸缉私等领域。毫米波成像系统主要分为主动成像系统和被动成像系统两种体制。毫米波主动成像机制与被动毫米波成像不同,需要馈源天线向被测目标辐射电磁波,并接收目标反射回的电磁波,进行图像重构,从而进行安检识别。主动式毫米波成像相比被动式,可以得到更多的被检目标信息,对目
复调和分析与函数空间理论是基础数学中重要的研究方向.自上世纪60年代以来,取得了许多重大的成就.单复变函数空间理论经过半个多世纪的研究已经取得许多优美的结果,但多复变
查尔斯·西米克(Charles Simic)是美国当代著名诗人,以对语言精确性使用的“魔术师”、东欧来的“移民者”、黑暗中的“玄而上学家”出现在公众的视野,有关他的研究大都围绕诗歌语言、移民身份和黑暗中的神秘思考而展开,虽然有研究者注意到了查尔斯·西米克诗歌的泛灵色彩,但并没有给予足够的重视。本论文对查尔斯·西米克诗歌中的泛灵论思想进行研究,考察西米克诗歌中泛灵论思想的来源、表现形态及意义。论文包
认知无线传感器网络(CRSN)是一种传统无线传感器(WSN)网络与认知无线电(CR)相结合的新型网络。它能够有效地缓解WSN中频谱资源匮乏的问题,具有很大的发展潜力。但CRSN仍然采
目的:本研究将雌性BALB/c小鼠及BV2小胶质细胞作为研究对象,通过感染弓形虫RH株速殖子建立急性弓形虫小鼠感染模型及BV2细胞活化模型,探究舍曲林(SERT)对弓形虫及弓形虫感染诱导宿主抑郁样行为的作用及机制,为防治弓形虫病的药物提供新的理论和实验依据。方法:(1)体内实验:将雌性BALB/c小鼠随机分为5组:正常组(N,未感染+未治疗)、模型组(CN,弓形虫感染+未治疗)、SERT组(弓形虫
近十年来,有机–无机杂化金属卤化物钙钛矿太阳能电池迅速崛起。它的飞速发展,得益于钙钛矿材料优异的物理和光电特性,如带隙可调、高吸收系数和载流子迁移率、载流子双极性输运、可全溶液制备和材料来源丰富。在高效稳定的钙钛矿光伏器件中,高质量的电子传输层对载流子的传输起着重要的作用,其主要作用是快速的抽取钙钛矿吸光层产生的电子并作为阻挡层有效阻挡空穴,从而减小载流子复合提高器件性能。采用不同材料作为电子传输
当发生自然灾害、恐怖袭击等紧急情况时,通信基础设施往往被摧毁,导致通信中断。此时,借助不需固定基础设施、组网迅速灵活的MANET技术可以快速组建应急通信网络。MANET主要
目的:通过检测弥漫性大B细胞淋巴瘤(Diffuse large B cell lymphoma,DLBCL)组织中Cyclin D2和Ki-67的表达来探讨它们在DLBCL分期分型中的临床意义,为DLBCL的治疗提供了更有价值的实验数据。方法:选取2013年01月至2018年10月在河北北方学院附属第一医院血液内科住院的60例DLBCL患者病理蜡块标本。入选标本均获得患者及家属同意,并签署知情同意
随着信息时代的到来,基于位置的服务逐渐在日常生活中扮演着重要角色。作为传统室外定位技术的强力补充,室内定位技术的研究近年来受到广泛的关注。其中,基于位置指纹的定位
在未来的片上多核处理器中,单个芯片上集成的处理器核心越来越多。由于传统的电互连在功耗效率和带宽密度上存在局限性,具有高带宽密度、低功耗、低延迟等特性的片上光网络(O