深度学习中的高效贝叶斯推断算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hot8391
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是机器学习的重要分支,是一种使用多层非线性变换结构进行模式匹配和预测的算法。近年来,深度学习被广泛应用在图像识别、自然语言处理和语音识别等领域,极大改善算法性能,在人工智能中扮演越来越重要的角色,但是在现实应用中深度学习的缺陷也凸显出来。深度学习的大部分任务是有监督学习,需要大量有标签的数据。深度学习模型计算复杂度高,算法容易被攻击,而且缺乏可解释性,其内部工作机制不清楚。贝叶斯推断方法依据大量贝叶斯统计理论,捕捉数据产生的过程。在深度学习中引入贝叶斯推断算法,可以为模型提供统计解释,改善模型的鲁棒性能,缓解上述问题。本文研究如何高效结合贝叶斯推断方法和深度学习,来弥补深度学习存在的缺陷。具体来讲,本论文重点针对深度表征学习中互信息估计、循环神经网络的模型压缩、以及变分自编码器的后验坍缩等问题进行深入研究,主要研究内容和创新如下:互信息在深度表征学习中起着重要作用。但是互信息在连续和高维情形中是难以处理。最近的研究尝试建立了易于处理且可微的互信息方法,然而这些估计方法要么具有较高的方差,要么具有较大偏差,这导致不稳定的训练或者较差的模型性能。我们探索另一个吸引人的策略——互信息的梯度估计。因为如果从优化互信息的角度看,我们不关心互信息自身的值,而是将其作为优化目标最大化或者最小化。为此,我们提出了一种基于隐式分布得分估计的互信息梯度估计方法。该估计方法不仅具有较低的方差而且具有较小梯度偏差。我们在各种深度表征学习任务上的大量实验证明了我们的方法的优越性。循环神经网络在许多应用中都取得了令人瞩目的成功。但是,这些模型的巨大尺寸和计算负担使其难以在边缘设备上部署。网络剪枝技术是一种减少循环神经网络的总体存储和计算成本的有效方法。尽管取得不错效果,基于Lasso正则化的修剪方法会在参数矩阵中产生不规则的稀疏形式,这限制了实际的加速效果。为了解决这一问题,我们提出了一种结构化稀疏推断方法,该方法通过神经元选择移除循环神经网络的神经元。更具体地说,我们引入了两组二进制随机变量,它们可以分别解释为输入神经元和隐藏神经元的门开关,可以生成参数矩阵二值掩码。我们证明可以通过最小化神经网络权重矩阵的L0范数来推断二值变量的离散状态,这可以看作对模型参数施加Spike-and-Slab先验。关于语言建模和机器阅读理解任务的实验结果表明,与其它的剪枝方法相比,我们提出的结构化稀疏推断方法具有更好的加速效果。变分自编码器是一种深度隐变量模型,被广泛应用到生成建模、半监督学习和表征学习。最近的研究表明,先验在变分自编器的数据密度估计中扮演着重要的角色。变分自编码器通常使用标准高斯先验,然而这种简单的先验会导致后验分布过正则化,使模型性能变差。这种过正则化现象称为后验坍缩。为了解决上述问题,我们提出了离散聚合先验,此先验可以从数据中学习潜在结构特征,更好的正则化变分后验。具体来说,我们在隐变量空间上找到所有数据对应隐变量的核心点,并利用Parzen Windows概率密度估计方法聚合成隐变量的先验。相比标准高斯先验和高斯混合先验,离散聚合先验具有更好的生成效果。
其他文献
研究目的:近红外光谱术(Near infrared spectroscopy,NIRS)是一项新的生物医学光子学技术,具有快速、无创、实时、在体检测的优点,可实现对人体组织血氧参数的有效监测,其应用特点受到广大体育科研工作者的青睐。文章研究运动员递增负荷运动后肌氧和血乳酸的恢复特点,分析肌氧参数与血乳酸参数的关联性,探索恢复期代谢能力评定和恢复评价的新指标和科学化手段。
会议
语言的建构和应用对小学阶段学生的全面发展具有重要作用,可以帮助学生形成良好的语文学科素质,加深学生对语文基础知识的理解,有助于提升学生的知识应用能力,使学生的思维和意识得到拓展,形成优良的审美品质,充分理解文化传承目标,基于正确的语言建构保障学生语言应用的实效性。一、对语言的内化予以高度的关注
期刊
在小学语文课堂教学中,古诗词教学是一个非常重要的板块,也是影响学生语文学习能力强弱的关键因素。所以,教师在对学生进行古诗词教学的时候,一定要讲究方式、方法的应用,通过对学生学习兴趣的分析与研究,制订符合学生学习需求的教学模式和路径,这样可以有效激发学生的学习动力。基于此,本文将从古诗词吟诵教学的角度进行问题的分析与探讨,利用案例佐证的方法对古诗词吟诵教学进行研究和论证在课堂中采取这样的形式能提高学
本文通过实验研究的方式围绕基于竹浆木质素系高效分散剂在水煤浆中的应用问题进行研究与分析,研究了竹浆木质素系分散剂制备过程中受分子量以及磺化度的影响情况,并对竹浆木质素系分散剂应用于酚水水煤浆过程中的影响因素进行研究,包括竹浆木质素系分散剂掺入量以及制浆温度这两个方面,所得出相关结论能够为后续实践工作的开展提供一定参考与指导,希望能够引起业内人士的关注与重视。
在国家“一带一路”倡议下,越来越多中国企业进入海外市场,加速布局国际业务。进入国外市场后,跨国企业直接暴露于陌生且复杂的海外环境中,缺陷和弱点会被进一步放大,国际化增长将面临更大的风险和威胁。尽管现有研究已经对跨国企业国际化进入后发展的驱动因素做了多维度分析,但这些观点侧重于跨国企业自身属性,集中讨论企业已经存在的企业特殊资源优势,即对其内部优势的扩大化利用。由于新兴者劣势与来源国劣势,中国跨国企
本文针对几类时滞神经网络(Neural Networks,NNs)系统,研究了其稳定性,无源性,耗散性,以及其状态估计问题。首先,本文以时滞NNs系统的稳定性问题作为开始和基础,为后续广义耗散性的研究做好了准备。随后,针对耗散性的一种特殊情形——无源性,进一步探讨了马尔科夫跳跃NNs的无源控制问题。最后,本文研究了半马尔科夫跳跃NNs的有限时间状态估计问题。全文基于Lyapunov稳定性理论,结合
经典合同理论将自利理性作为分析的基础,但是大量研究表明以自利理性为基础的合同理论未能很好的解释和预测现实中人们的真实决策,例如Lim和Ho(2007)[1]以及Ho和Zhang(2008)[2]的研究表明了几种不同的合同(如两部定价合同、数量折扣合同等)在实验中未能达成理论预测的供应链协调结果。特别地,行为经济学的研究表明人们在经济决策的过程中不仅会考虑其自身经济利益,也会考虑他人的利益。这些行为
物联网技术快速发展与广泛应用,对高精度高可靠性温度、湿度等目标对象动静态特性感知与测试提出了新的挑战,探索发展新型温度、湿度等动静态物理特征感知机理及实现技术已成为学术界和产业界的研究热点。温度、湿度等物理量感测灵敏度、精度、线性度等性能直接决定了物联网节点的性能和可靠性。新型人工电磁结构(又称超构材料)具有负介电常数、负磁导率、强谐振性等特征及负折射、逆Cerenkov辐射、逆Doppler效应
场景理解是机器学习、模式识别等学科非常活跃的研究方向。图像分类和图像语义分割是场景理解的两个重要研究内容,虽然随着机器学习方法的不断发展已取得突破性的进展,但依然存在一些亟需解决的问题。本文以图像分类为主要研究对象、机器学习方法为主要研究手段,重点针对经典机器学习方法下图像分类任务中的低分类率图像类别的识别问题、视觉字典的学习耗时问题和场景理解的多任务集成模型设计问题,以及深度学习模式下图像分类网