基于FPGA的卷积神经网络系统的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wuzx5858
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Network,CNN)是一种典型的多层神经网络,它是首个真正意义上成功训练多个层次网络的结构模型,其权值共享的网络结构使之在图像处理、语音识别等有着重要的应用价值。CNN算法通常是在CPU或GPU上以软件编程的方式进行实现,这种实现方法简单却无法发挥CNN并行性的特点,训练速度慢。FPGA含有丰富的计算资源,基于SRAM结构的FPGA能够在FPGA运行过程中对片上的资源进行重新配置,实现系统逻辑功能的切换,提高系统的灵活性和资源利用率。本文提出了以FPGA的动态可重构技术实现CNN的方法。本文首先介绍了基于FPGA的动态可重构技术的重构方法、配置技术和实现流程,并根据CNN算法的特点制定了合适的重构配置方案。对CNN的计算模型、网络结构和激活函数进行了简单地介绍和分析,并对FPGA实现CNN可能出现的问题进行了简要分析,并提出了对应的解决方案;接下来分析了CNN的可重构性和并行性,将CNN的训练流程分为了四个不同的阶段,包括初始化阶段、前向传播阶段、反向传播阶段和权值更新阶段。论文设计了一种网络结构较为简单、权值数量较少的卷积神经网络算法,称为My Net算法,并以My Net算法的前向传播模块为基础实现基于FPGA的动态可重构系统。将My Net算法的前向传播阶段分为了3种不同的子模块:卷积子模块、子采样子模块和全连接子模块。以卷积子模块和子采样子模块为主,对卷积运算和子采样运算进行了详细地分析,提出了具体的实现方法;提出了一种时序控制策略,保证了模块之间的顺序执行;以Verilog HDL为基础实现了系统的各个模块。在CPU上对My Net算法进行实现和测试,并与Lenet-5算法的性能相对比,证实了其不错的训练速度和较好的性能;对系统的各个模块分别进行测试,验证了模块的功能;以任意多个模块为例,测试了系统的时序控制策略;最后对整个系统进行了测试,验证了系统的正确性。
其他文献
分析了生态敏感区经济可持续发展的主要特征、模式和目标,构建了包含人口、资源、环境、经济发展四要素的生态敏感区经济可持续发展框架。明确了该框架下生态敏感区只有以环
目的:研究清肺止咳汤对慢性支气管炎的临床疗效。方法:将本院2004年—2008年88例慢性支气管炎临床病例随机分成两组,治疗组44例采用清肺止咳汤治疗,对照组44例采用蛇胆川贝液
目的:探讨杏仁核的空间形态与位置的三维重建技术,为颅脑立体定向手术提供可视性的解剖学基础。方法:成年健康自愿者,男性20例,女性20例,应用1.5TMRI,在标准的脑立体定向空间做
<正>对于庸官懒政,我们已经形成这样一种共识,那就是"懒政"的危害已经毫不逊于腐败。如果说治理腐败要大力提升廉洁,那么治理懒政就要大幅提升效率,要从干部制度、明确政府部
新疆蕴藏着丰富的煤以及煤层气资源,煤炭资源位居全国第一。煤层气经除杂、脱水、增压后进入周边天然气管道作为民用燃气供给用户,或者以CNGLNG形式作为车用燃气对外销售。新
对近4年焦炭单月日均产量情况、近7年各年度1—5月份焦炭累计产量情况、焦炭进出口情况进行了分析,在此基础上对近7年各年度1—5月份焦炭供应总量的变化情况进行了分析,并对
目的探讨急性早幼粒细胞白血病(APL)分化综合征(DS)的临床特征和影响预后的因素。方法收集中山大学附属第一医院2003—2010年收治的97例APL患者,采用维甲酸或维甲酸联合三氧
酒店类建筑,特别是五星级酒店,体量较大,功能较全,相比其他类型的公共建筑能耗强度相对较高。因此,对五星级酒店建筑的能耗水平和节能技术进行研究显得尤为重要。《建筑能耗
本文通过对殷墟卜辞所记"小臣■"的考证,认为小臣■所处时代、身份地位与文献所记商代傅说其人颇为相近,又"傅"与"■"古音同义近,因此文献所记傅说很有可能就是殷墟卜辞所记"
目的:研究走马胎中化合物AG4对人鼻咽癌细胞裸鼠移植瘤生长的影响。方法:建立人鼻咽癌细胞裸鼠皮下移植瘤模型,以抑瘤率为指标研究化合物AG4的体内抑瘤作用及AG4干预对裸鼠的