卷积神经网络定点化关键问题研究

来源 :北京化工大学 | 被引量 : 3次 | 上传用户:single654321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Networks,CNN)是诸多人工神经网络中的一种,基于卷积神经网络的目标检测凭借其识别精度高、鲁棒性良好、易于实现等优势,在深度学习领域受到了广泛关注。然而,随着识别精度要求的提高,CNN的参数规模越来越大,海量的卷积计算影响了运算速度,同时,浮点数的卷积计算复杂度高。因此,卷积神经网络定点化加速计算已成为目前卷积神经网络在嵌入式设备上优化计算的一个重点研究方向。本文针对卷积神经网络参数规模大、计算复杂度高以及在资源受限的设备上运行速度慢的问题,提出了一种基于现场可编程门阵列(FPGA)的CNN参数定点化计算方法。根据CNN模型参数分布和卷积计算特点,分析了导致CNN模型计算速度慢的关键因素,提出了一种基于FPGA的定点化加速卷积计算方法。为了进一步减小CNN参数定点化位宽长度,同时保证较小的精度损失,提出针对卷积神经网络输入特征图参数量化的优化策略。同时,从FPGA定点计算方面进行优化,使定点化后的卷积神经网络能够适应FPGA的硬件资源配置,从而充分利用乘加器等资源,最大化加速卷积计算。为评估定点化方法和定点计算模型的有效性,本文选取了多个CNN模型作为被测对象,设计动态定点化方法对模型的权值参数和输入特征图参数进行量化,并分别对量化前后参数文件大小、精度变化和运行速度三方面进行了对比和分析。实验结果表明,在满足基本CNN模型结构的前提下,本文提出的基于FPGA的定点化加速卷积计算的方法是可行且有效的。相较于传统的浮点卷积计算,本文提出的定点计算方法,在保证CNN模型精度损失不大于2%的前提下,当权值参数和输入特征图参数量化达到7Bit时,存储空间压缩了约4.5倍,卷积计算加速了约18.69倍,同时提高了 FPGA中乘加器的利用率,是一种有效的卷积神经网络定点化加速方法。
其他文献
市场流动性是衡量金融市场质量的一个重要指标,同时也是金融市场有效运行的重要保证,流动性对于金融市场的稳定发展具有极其深远的意义。流动性在期货市场中起着非常重要的作
中东呼吸综合征冠状病毒(Middle East respiratory syndrome coronavirus,MERS-CoV)是2012年出现的新型冠状病毒,该病毒能够引发严重的人类呼吸系统的疾病,其致死率高达36%,
<正> 过敏性紫癜是以全身性小血管损害为主要病理基础的疾病,以皮肤、胃肠道、关节、肾脏受累为主要表现。其中肾脏受损的程度决定其远期预后。过敏性紫癜好发于儿童,近年来
会议
"推理能力"是《义务教育数学课程标准(2011年版)》中的十个核心词之一。在小学数学教学中存在大量的合情推理,让合情推理更合理,感受数学推理的严谨性,需要学生经历"从特殊到
研究目的(1)调查妇科癌症患者创伤后成长的现状,了解患者心理状况。(2)分析妇科癌症患者创伤后成长与社会支持、应对方式、反刍性沉思的相关性。(3)探讨妇科癌症患者创伤后成长影响
在中国南方潮湿多雨地区公路工程的路基填筑过程中,高液限填土的使用非常广泛,其力学特性直接影响路基的长期稳定性。由于降雨较多,在实际工程中很难将路基填土完全压实,影响
在常规的高层结构设计中,一般将上部结构和基础部分分开设计,既分析上部结构时认为基地固定,忽略基础和地基土的变形对其内力的影响。而实际上地基基础-上部结构三者共同工作
近十年以来,我国对于小学性教育的研究一直呈现上升趋势,但是相比较于教育学其他领域的研究还是存在一些差距,研究我国小学性教育的文章数量不多,而且文章的质量也还有很多提
色素上皮细胞衍生因子 (pigmentepithelium derivedfactor ,PEDF)最初从视网膜色素上皮细胞分离 ,是维持角膜、玻璃体无血管状态的主要血管增生抑制因子。体内外试验证明 :PE
Nd-Fe-B基永磁材料因具有优异的磁性能,广泛应用于新能源汽车、风力发电、磁悬浮轨道等各大传统与新兴领域。由于Nd-Fe-B基合金的高温性能较差,难以在高于150oC环境中使用。