基于信息量化对知识蒸馏的探究

来源 :山东大学 | 被引量 : 0次 | 上传用户:liyn000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,知识蒸馏在深度学习中有着很广泛的应用,它以出色的表现成为了一种炙手可热的模型压缩方法,实现了以更小的模型达到更好的准确率。相对于其它的网络压缩方法,知识蒸馏能够很好的将大的网络压缩至小网络,从而易于部署。随着知识蒸馏的研究的深入,该技术在机器视觉的很多方面都有了突破性的应用,在基本的知识蒸馏的基础上,也发展出了各种新式知识蒸馏方法。然而在各种知识蒸馏策略爆发式出现的同时,理论上对于知识蒸馏的解释却依然处于起步阶段。从知识蒸馏的诞生之初,它就被解释为教师将所学的知识传授给学生,即学生会学到了更多的信息。解释深度学习策略往往依靠于可解释机器学习这一学科的发展,将信息论这样一个成熟的数学概念运用到神经网络领域中,从而探究神经网络的可解释性是非常有必要的。其中信息瓶颈理论作为信息论的一个重要分支,其发展出的信息平面方法可以很好的可视化神经网络学习过程中互信息曲线,从而了解神经网络训练过程中的信息变化。基于这些,本文从以下两个方面分别对知识蒸馏的策略进行解释:1.信息增量——这是本文基于信息论提出的一个新的神经网络信息量化方法,用以量化神经网络训练前后所获得到的信息量;2.信息瓶颈,用以可视化神经网络在蒸馏前后的互信息曲线。本文的主要工作如下:1.本文从信息增量的角度探索知识蒸馏。提出新的信息量化方法,给出计算方法和推导过程,并总结出其一些特性。本文利用该方法可视化对比了知识蒸馏前后的信息增量,从量的角度探究了知识蒸馏对网络信息量的影响。本文还探究了不同的参数下知识蒸馏的信息增量差别,总结出了信息增量同蒸馏参数之间变化规律;2.本文从信息瓶颈的角度探索知识蒸馏。基于信息瓶颈和信息平面方法,本文探究知识蒸馏前后互信息曲线的差异,从而理解网络在知识蒸馏后对原网络信息获取的改变,得出知识蒸馏使得学生网络在训练终点达到了一种更小更充分的表示,本文进一步的还探究了不同的参数下知识蒸馏的互信息曲线的差别;3.本文从变分信息瓶颈的角度探索知识蒸馏,用变分信息瓶颈的方法使得教师网络监督学生网络,从而提出基于变分信息瓶颈的知识蒸馏框架,在CIFAR-10数据集上给出了其实验结果。
其他文献
在国家大力倡导素质教育的大环境下,钢琴教育作为音乐教育中的分支,始终占据重要地位,近年来,越来越多的家长把学习钢琴作为培养孩子音乐艺术修养、启蒙才智的重要途径。众所周知,儿童对事物的认知具有其特殊性,这个阶段也是音乐启蒙与音乐素养培养的关键时期。所以我们要关注儿童阶段音乐教学的特殊性,以最为科学的教育理念与教学方法,开启孩子们对音乐的认知,启蒙他们的才智,进而培养学生的兴趣与能力。皮亚杰儿童认知发
学位
研究背景随着我国近几十年来经济社会的迅猛发展,人口预期寿命持续延长,人口老龄化成为了我国社会发展进程中的重大问题。与此同时,我国的城镇化进程也在不断加快,人口流动规模逐年扩大,老年流动人口总量不断增加。随迁老人受到内部“年老”和外部“流动”的双重因素影响,面临着更为严峻的生存挑战和健康威胁,不可避免地成为了我国的新型健康弱势群体。而健康相关生命质量(Health-related quality o
学位
[目的]来自于大脑中缝背核内部的五羟色胺(Serotonin,5-HT)能神经纤维可以投射到小脑皮层广泛区域,通过5-HT受体调节小脑皮层神经环路功能活动,调节浦肯野细胞(Purkinje cell,PC)向小脑深部核的指令输出。但迄今,5-HT对小鼠小脑皮层PC自发性放电活动的调节机制尚不清楚。本研究在乌拉坦麻醉下,采用在体电生理记录技术,研究5-HT对小鼠小脑皮层Vermis区PC自发性放电活
学位
智能合约作为部署在区块链上的一种代码脚本,能够在被事务调用时自动为用户完成预定的业务或计算。但伴随着区块链的应用场景变得多样而复杂,智能合约正变得越来越复杂,智能合约中所包含的计算量也出现了大幅上升。据统计,以太坊上已经出现了计算耗时超过20秒的智能合约。因此,计算密集型合约事务被用来指代此类验证过程需要消耗大量计算资源的智能合约的调用事务。如何实现区块链对计算密集型合约事务的快速验证,成为区块链
学位
为微损、快速测量树木早晚材密度,提出了一种基于微钻阻力的早晚材密度测量方法。使用自制微钻阻力仪和德国Resistograph 650-S微钻阻力仪测量了10个辐射松长方体木块的钻针阻力,使用体积法测量了各生长轮的早材绝干密度和晚材绝干密度。以木材绝干密度为因变量,以每个生长轮早材部分和晚材部分对应的平均阻力值为自变量,使用4/5的试验数据分别建立2个微钻阻力仪钻针阻力与早晚材绝干密度的线性回归模型
期刊
研究背景和目的卵巢癌是致死率最高的妇科恶性肿瘤,其发病隐匿,发现时通常届以晚期。高级别浆液性癌(High-grade serous cancer,HGSC)约占上皮性卵巢癌的70%,其恶性程度极高,预后差,严重威胁广大女性同胞的生命健康。目前,全面的肿瘤细胞减灭和以铂类为基础的联合化疗仍然是HGSC治疗的基石,虽然HGSC在初始治疗中多数表现为铂敏感,但是,随着病程的进展,最终还是难逃复发和铂耐药
学位
脊髓损伤(spinal cord injury,SCI)是一种严重的中枢神经系统损伤,患者需要长期以及复杂的康复训练。按照病因学分类,SCI主要包括原发性SCI和继发性SCI。原发性SCI主要指由椎体骨折和脱位造成的机械性损伤。继发性SCI发生于损伤后的数分钟并持续数月,对脊髓造成持续性损害。其中炎症反应在继发性SCI中占据主导地位,如何能缓解SCI后的炎症反应成为研究人员一直以来关注的问题。小胶
学位
<正>家校社协同育人是新时代落实立德树人根本任务的重要基础。近几年,西咸新区沣西第一小学在信息技术实践的运用中,选择以二维码为载体,开发出包括码平台、码空间、码资源、码应用等架构体系的“码行天下”,进行教育教学改革创新,以更直接的方式服务社会、家长和学生,有利于学生发展,并为学校、家庭、社区的合作发展提供了广阔的前景。
期刊
提高能源利用率,实现节能减碳,是电力系统发展面临的重大挑战。台区作为电网的末端环节是损耗最大的电压等级层,具有巨大的降损空间,亟需提升理论线损计算水平以制定更加有效的降损措施。随着电网监测技术与信息系统的发展,数据驱动方法在理论线损计算中具备了良好的应用前景。然而台区终端采集仍普遍存在时空覆盖不全面、数据质量不稳定等问题,数据驱动的理论线损计算方法如何在有限条件下发展完善值得深入探讨。在此背景下,
学位
在“双减”背景下切实做到减负提质增效,需要家庭、学校、社会的共同协作,为少年儿童身心健康成长提供和谐氛围。我们从拓宽牢固的育人阵地,做实协同育人教育工作;建立优质育人队伍,提升协同育人师资水平;开展丰富育人活动,彰显协同育人活动成效;构建一体化育人模式,探索协同育人宽广路径四个方面入手,进一步明确教师的主导地位、家长的主角地位、社会的补充地位、学生的中心地位,切实减轻学生学业负担,有效促进学生健康
期刊