玻尔兹曼机的参数选择理论及应用

来源 :天津大学 | 被引量 : 1次 | 上传用户:zhusimeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习模型已经在众多应用领域取得了引人瞩目的成功。相对于经验意义上的成功,深度学习在模型设计和训练方法等方面的理论基础相对薄弱。实际中,研究者需要通过大量试错来设定模型结构和控制模型训练过程。由于缺乏理论指导所造成的设计复杂性已成为限制深度学习更广泛应用的瓶颈。本文旨在解决无监督设置下神经网络的参数选择(约简)问题:利用尽量少的参数,保留尽量多的目标概率分布的信息,用以提高应用模型的计算效率和泛化能力。论文将玻尔兹曼机作为研究对象,因为:1)其作为基本构件广泛应用于很多深度学习模型中;2)信息几何理论为其提供了较完备统一的理论分析工具和解释视角。基于信息几何理论,我们将模型的参数选择问题转化为统计流形上几何结构的最大化保持问题。具体的,本文的主要研究内容包括:1.提出了多元布尔分布族的一般性参数选择准则。参数的相对重要程度定义为Fisher-Rao信息距离在该参数方向的贡献分量(称为可信度)。我们可以保留可信度高的参数,而给低可信度的参数赋予中立值(通常为0)。上述参数选择准则称为可信信息优先原则。我们证明可信信息优先原则所实现的子流形可以最大程度地保持概率单纯形上任意一点与其小ε-邻域球上各点之间的期望Fisher-Rao信息距离。2.解析了不同类型玻尔兹曼机对可信信息优先原则的实现方式,进而揭示玻尔兹曼机估计多元布尔分布的优化意义。3.提出了在给定样本情况下玻尔兹曼机的高效模型选择算法。我们可以依可信度确定模型参数的优先顺序,并设计了假设检验方法用以自动辨识参数可信度的显著性水平,显著降低了模型选择的时间复杂度。4.提出了针对深度神经网络的结构正则化方法,用于解决训练过程中的过拟合问题。我们通过保留可信度高的边组成可信网络(称为ConfNet),并设计训练算法实现网络结构的动态调整,达致模型复杂性与训练样本规模之间的平衡。
其他文献
贝加莱公司生产的B&R2000系列PCC是一种可实现从简单的逻辑控制到复杂分散化的自动控制系统.以东风4C机车为例,分析了目前内燃机车柴油机起动中存在的蓄电池亏能及燃烧状态不
《暗恋桃花源》是台湾戏剧导演赖声川的重要作品。作为台湾乃至中国当代戏剧史上颇具革命创新性的作品,赖声川通过对于西方戏剧理论的借鉴与颇富中国文化精神的表达,以巧妙的
正常人胃液pH值为1.5~2.0,主要成分为盐酸,胃内酸环境可有效杀灭伴随食物进入胃内的各类微生物,维持胃和小肠的无菌状态,以及内环境的稳定及正常生理功能;但正常人胃内仍可分
你可能会觉得印度的银行规模太小,孟买证交所的24层大楼远不及上海证券大厦气派,但印度金融业的能量却一点也不容小觑。中国工商银行行长姜建清如果看到印度国家银行(SBI)的
期刊
科学观念在中国的确立,为文学理论的科学性诉求提供了语境、理论基础和方法论依据。自20世纪20年代文学理论萌生自觉的学科意识起,即把自身定位为一门研究文学活动与文学现象以
为实现对系统的有效控制,针对杜芬方程在特定参数设置下所出现的混沌现象及其特性,提出了基于参数微扰和变量反馈的控制方法,这种方法能对混沌系统进行有效的控制,通过调节反馈系
背景和意义本文描述了人和计算之间交互基础。它提供了一个独立载体计算的理论框架,并展示了实际的神经信息的编码和传输。这项研究主要关注的是意向信息在人们之间的传达,接
在各种主题的初中历史公开课上,很难看到复习课的影子。究其原因,新课程改革对教师、对学生的评价方式还没有从根本上得到改变,很多教师对复习课的内容、形式等不敢放开手脚
目的探究急性心力衰竭(AHF)患者的血尿酸(UA)和N-端脑利钠钛前体(NT-ProBNP)水平与健康成年人的差别,并探讨两指标检测水平对急性心力衰竭的预后预测意义。方法选择2015年5月~2016
2014年11月9日,国家主席习近平在人民大会堂会见加拿大总理哈珀。习近平指Hi,哈珀总理这次访华取得积极成果,双方就发展中加关系达成一系列共识和协议,建立了两国外长年度会