资源受限场景下的卷积神经网络模型压缩与加速研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jma_sd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络在图像分类、目标检测、人脸检测和人脸识别等领域有着重大的突破。然而,目前卷积神经网络模型存在参数量庞大,计算代价高昂等问题,使得模型难以部署到如手机、无人机、AR眼镜等资源受限设备中。因此,研究卷积神经网络模型压缩与加速具有重要的意义。本文从网络量化出发,通过将全精度网络模型参数和激活量转换为低比特定点数,极大地减小了网络模型所占的内存空间大小。与此同时,卷积操作中的浮点数乘法也可用定点数乘法代替,显著地降低了网络的计算代价。然而现有模型量化和训练方法还存在如下问题:(1)低精度模型训练难度大,导致量化模型性能损失大;(2)网络的权重和激活量服从非均匀分布,现有均匀量化算法难以拟合这些数据分布;(3)在网络的训练过程中很难选择合适的学习率。本文针对每个问题提出相应的改进方案。首先,针对问题(1),本文提出一种基于知识蒸馏的卷积神经网络量化训练算法。该算法引入相对熵损失函数来衡量全精度神经网络和量化神经网络的输出分布,然后同时训练全精度模型和量化模型,使得全精度模型能够给低精度模型提供额外的监督信息,减少低精度模型的性能损失。其次,针对问题(2),本文提出一种非均匀量化算法。该算法将量化函数中的均匀离散函数替换成可训练的非均匀离散函数,并同时训练卷积神经网络参数和量化器,以提升量化模型的性能。最后,针对问题(3),本文提出一种基于线搜索的优化方法。该算法通过线搜索自动选择合适的学习率,使得网络能够收敛到一个更好的局部最优解,从而提升模型的性能。通过大量的实验表明,本文所提出的三种方法能够有效提升网络模型的性能。
其他文献
目标检测是计算机视觉的重要组成部分,主要是定位一张图片或者视频中特定物体出现的区域并判断图像中出现的目标类型。随着深度学习的发展,基于深度学习的目标检测在众多领域
无线射频识别技术(Radio Frequency Identification,RFID),具有非接触、识别距离远、保密性高、抗干扰能力和环境适应性强等优点。RFID室内定位技术的研究不但具有广阔的市场
随着视觉大数据的和人工智能的发展,视频数据的分析是未来计算机视觉领域的关键,其中监控视频的行人识别、检索和分析是一项越来越重要的任务。多个摄像头之间的行人匹配任务
自动语音识别技术作为一项核心技术在呼叫中心、医疗服务和移动应用等领域得到了广泛的应用。随着国内外对语音识别技术研究的快速发展,汉语、英语等资源丰富语言的语音识别
腹部存在许多重要器官,而腹部医学图像是腹部器官疾病的重要诊断依据,在临床实践中,医生对腹部器官和肿瘤的自动分割算法提出了很高的要求。然而,基于医学图像的分割方法的研
针对网络文本情感分析,本文提出了一种基于复杂句式和复杂语义的情感分析模型,并将其应用于句子级多维情感分类。首先在特定领域文本语料基础上进行多维情感词扩充,建立多维
在当今大数据、移动互联网等信息技术的飞速发展下,信息技术已经渗透到社会经济和生活等方方面面,其在教育方面发挥的重要作用日益凸显。中央在《国家中长期教育改革和发展规
随着工业的快速发展,我们的生活环境中产生了大量的有毒有害气体。气敏传感器作为检测气体成分及浓度的重要工具被大量地应用在工业和生活的各个领域。金属氧化物气敏传感器
电子邮件用户面临的一个令人头疼的常见安全问题就是每天会接收到大量垃圾邮件。目前,大多数电子邮件系统中的传统对策是简单的过滤机制,即根据用户定义的一些关键字来阻止或隔离不需要的电子邮件。针对传统的垃圾邮件过滤技术的精确率和召回率比较低以及过滤不稳定等问题,改进了树突状细胞算法(Dendritic cell algorithm,DCA)并应用于垃圾邮件过滤,改进后的算法在召回率、精确率和误报率等性能方
随着云计算、物联网等新兴业务的飞速发展,各个领域的数据信息呈爆炸式增长,导致“信息过载”、“信息迷航”等问题的出现。为了帮助用户快速找到自己喜欢的产品,推荐系统应运而生。而推荐算法作为推荐系统的核心,已成为学者研究的热点。其中协同过滤算法成为最流行的方法之一,在推荐系统中被广泛地应用。然而许多推荐系统只考虑单一因素的影响,导致推荐准确性比较低,推荐效果不好,因此在传统算法的基础上考虑多个影响因素的