基于乘积量化的深度神经网络压缩方法

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:qinggo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络在计算机视觉、自然语言处理和文本数据等各个领域取得卓越成就。但随之而来的问题是深度神经网络随着模型加深和过度参数化,其网络规模、计算量、耗电量、存储量都在成倍增加,最终导致超大体系结构计算效率较低。尤其是对于具有受限计算和能力资源的应用程序,例如Web服务、移动和嵌入式设备。针对深度学习架构在计算上昂贵且占用大量内存,无法部署在内存资源低的设备(如手机)或移动端的问题,本文提出了一种基于剪枝与乘积量化组合使用对多种不同深度神经网络进行深度压缩的方法,解决深度神经网络中冗余参数过多,模型存储量大等问题。本文压缩网络的第一步是先正常搭建并训练好网络保存最佳参数模型。第二步即利用剪枝方法先阈值扫描确定阈值将网络权重矩阵中低于确定阈值的权重连接剪开减少深度神经网络中冗余参数,然后重新再训练网络补偿损失的性能,再利用乘积量化聚类实现权值共享,牺牲少部分精度,使得神经网络模型的参数量化为8bit,节省了网络的内存开销,提高了网络的压缩比和加速比。在基于GPU的Pytorch框架环境下,本文提出的方法在尽量不损失精度的前提下将LeNet-5、MLP、AlexNet、ResNet 和 VggNet-16 网络模型在 Mnist 或 CIFAR-10 等数据集实验下压缩至23至59倍,同时实现了 1.52至3.3倍的加速比,比单独剪枝压缩提高了至少一倍的压缩率,同时乘积量化相比Kmeans量化加速比提高了一倍以上。实验结果表明通过基于乘积量化结合剪枝的压缩方法,使得卷积神经网络在尽量不损失精度的要求下压缩比和加速比得到大幅度提升,从而让深度神经网络方法应用于嵌入式平台成为了可能。
其他文献
建筑用铁氧体电磁波吸收材料是一种特殊的新型建筑材料,应用这种新型建材,可以解决由于高层建筑的日益增多,建筑物本身产生电磁波反射而破坏电磁波环境的问题。本文简要介绍其特
随着技术的不断发展,快慢文化步入人们的生活,“快”的出现与效率时代和速食时代有关,当人的认知速度跟不上时代发展的脚步,便催生了“慢”文化,“慢”是对“快”的理性反思
数列是高中数学中非常重要的章节内容,对于学生来说还是比较容易理解,深入理解数列能够有助于解决实际问题。并且扩大数学视野,提高数学解题技能,不仅有助于知识的延伸,也使
晋北地区旱地应用机械穴灌穴播和地膜覆盖技术种植玉米,比常规机械穴播玉米出苗早5d,拔节早8d,抽雄早8d,成熟早7d,株高增加7cm,成穗数增加8463穗/hm^2,穗粒数增加17粒,千粒重增加21.0g,
【正】 “要真正能够在上海寿险市场上站住脚,关键就看今后一年多的时间,也就是我国政府在加入WTO时承诺的,在2004年底全面开放中国保险市场之前,我们是不是已经做好了充分的
茶文化是我国文化的重要内容,切实反映了我国的文化内涵和思想内涵。经过几千年的积淀和发展,茶文化逐步成为影响大众的重要文化标志。随着大众生活水平的提升,茶文化受到更
近年来,我国建筑业发展十分迅速,住房体系也在不断变化,房屋在转型,房屋维修受到人们越来越多的关注。住房维修基金的缴纳管理和使用,直接影响到居住者的利益。为合理的运用
信息化使生活更为快捷高效。信息技术渗透于教育界中,能够大大的提高教育质量,促进教学效率的提高,使教育迎来新的变革。在高中地理教学中,利用信息技术进行教学能够促进学生