利用流形结构的高效贝叶斯推理方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:MyLoverQLH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯模型因其灵活的建模能力和稳定的学习表现使得它在人工智能及机器学习领域中得到了广泛应用,而当前大数据环境的特征则为贝叶斯模型的学习过程,即贝叶斯推理,带来了新的挑战和需求。多样的数据形式要求贝叶斯推理方法可高效处理变量的流形结构,复杂的模型结构需要推理方法具有更强的近似灵活性,繁重的后续任务要求推理方法的粒子高效性,而巨大的数据规模则需要推理方法可高效利用推理时间和计算资源。另外,新的高效推理方法的设计与开发也需要对现有种类繁多的方法其背后的根本原理和联系进行分析。而流形这一数学概念因其具有包容性的定义、丰富多样的结构和对本质几何特征的描述,可为分析和解决这些问题提供根本的视角和有力的工具。本文针对这些挑战和需求,利用数据和模型的显式或隐式的流形结构,面向马尔可夫链蒙特卡罗(Markov chain Monte Carlo,MCMC)及基于粒子的变分推理(particle-based variational inference,ParVI)这两个贝叶斯推理的关键领域,为增强贝叶斯推理方法的高效性展开理论和实践上的研究。具体贡献包括:1.提出了随机梯度测地线MCMC方法,使得针对流形变量的MCMC方法处理大规模数据的时间效率有了本质提高;2.开发了黎曼-斯坦因变分梯度下降方法,提高了现有ParVI方法的迭代效率,并为处理流形变量的贝叶斯推理任务首次带来了兼具近似灵活性和粒子高效性的ParVI方法;3.分析了ParVI方法所依赖的假设,揭示了现有各ParVI方法之间的联系,并依此理论开发了两个新的ParVI方法以及可适用于所有ParVI方法的加速框架和带宽选择方法,增强了ParVI方法的算力效率和粒子高效性;4.建立了将一般MCMC方法描述为沃瑟斯坦空间上的流(flow)的统一理论框架,系统地解释了现有各MCMC方法的行为机理,并将其与ParVI方法建立了一般性的联系,进而依此理论开发了两个新的ParVI方法,提高了ParVI方法的算力效率和MCMC方法的粒子高效性。
其他文献
镜像生物学系统作为一门新生的生物学领域,目前在生物医学等行业展现了非常大的应用前景。例如它可以用于构建新的镜像中心法则以及用于镜像核酸适配体药物的筛选。但在这一个领域的发展构建过程中面临着一个重大的阻碍,即缺乏合适的镜像DNA测序技术。尽管如今测序技术已经取得了巨大的发展,但没有报道表明现有的测序技术是能够应用到镜像DNA的序列测定的。由于缺乏特定功能的镜像酶,目前大多数测序技术采用边合成边测序方
陆生植被是全球碳水循环的重要组成部分,把握植被碳水耦合特征及其对环境水分条件的响应机制,对全球碳水循环和气候变化模拟具有重要科学意义。本研究从植被导度受水分约束调节的机理入手,通过模型模拟与理论分析相结合,探讨了植被导度与环境水分条件的响应关系,并深入研究植被日内碳水通量耦合迟滞特征以及植被用水效率受环境水分条件的影响关系,研究为理解植被碳水通量耦合的变化特征和规律提供了新的视角。基于Penman
五次卡拉比-丘3-流形的Gromov-Witten不变量的计算是Gromov-Witten理论中的核心问题之一。在物理文献中,BCOV全纯异常方程是唯一一个可以有效地计算高亏格不变量的方法。BCOV全纯异常方程是非全纯自由能的一族二次递归关系,物理学家用该方程与一些其它条件递归地解出非全纯自由能。然而,非全纯自由能与全纯异常方程在数学上并没有一个严格定义。物理文献指出,非全纯自由能的非全纯部分来自
蛋白质结构从头预测作为结构生物学领域最为重要和最具挑战性的问题之一,是蛋白质分子从无规则结构逐步折叠成天然态构象的过程。蛋白质结构从头预测的研究对理解蛋白质折叠机理和了解蛋白质构象的动态变化与功能行使之间的关系具有重要的意义。作为从头开始结构预测的主要组成部分,高效的构象搜索算法和精确的势能函数是结构预测模型准确性的重要保证。伴随着Rosetta程序的巨大成功,近二十年以来,片段组装法已经成为最为
对星系来说,给定波段内的恒星质量-光度比值(质光比)与其光学颜色之间存在紧密的相关性,这些相关性已被广泛应用为快速估计星系恒星质量的工具。然而,这种估算方法通常使用宽波段测光的能谱或者星系中心的光谱信息进行校准,目前还不清楚同样的估算公式是否可以直接应用于星系的不同区域而得到没有偏差的恒星质光比。在本文中,我们利用SDSS/Ma NGA巡天项目提供的积分场单元光谱,检查了空间可分辨的由全光谱拟合得
蛋白质的天然态构象中,残基与残基之间的接触信息包含了非常丰富的蛋白质结构信息。随着蛋白质序列数据库的积累、蛋白质残基共进化算法的进步、以及机器学习和深度学习算法的发展,蛋白质残基接触预测逐渐成为预测蛋白质三维结构的重要手段之一。利用蛋白质残基接触预测,可以大大降低预测蛋白质三维结构的复杂度,降低三维结构的搜索空间,提高蛋白质结构预测的效率与准确率。目前,残基接触预测算法大都将蛋白质的共进化矩阵视为
一个好的微观理论具有很高的对称性,但是由于物质之间存在复杂的相互作用,宏观体系的对称性往往很低。对称性破缺将微观高对称性理论和宏观低对称性体系联系起来。手征对称性是色动力学重要的整体对称性,对于研究强相互作用物质的组成、结构以及多体性质具有重要的作用。本文将通过多种方法研究平衡态和非平衡态的手征相变,以及不同外界条件对于QCD物质对称性的影响。对于平衡态相变,本文采用非微扰和超出平均场方法,关注动
本文主要研究了两个问题:1.空间均匀的Bose-Einstein粒子模型的量子Boltzmann方程在非对称初值下解的整体时间存在唯一性;2.该解强收敛到Bose-Einstein分布的长时行为及收敛速率的估计。Bose-Einstein粒子模型的量子Boltzmann方程描述了稀薄的Bose气体分布函数的时间演化。由于量子效应,此方程中出现了关于解的三次碰撞积分,它比经典Boltzmann方程中
对于q个互异的扩充复数构成的集合Eq={a1,…,aq}(q≥3),我们称#12为集合Eq的Ahlfors常数.其中,f∈M表示f是闭单位圆盘△上的非常值亚纯函数.Ahlfors常数H0(Eq)是Ahlfors第二基本定理(定理1.1)中的系数h的最小允许值,以较复杂的方式依赖于a1,…,aq.现有的文献中,几乎找不到关于H0(Eq)性质的结论.粗糙地说,a1,…,aq越是彼此靠近,H0(Eq)就
随着元器件尺寸逐渐到达极限,基于传统半导体技术的集成管电路中的量子效应越来越明显。量子技术的研究和发展越来越多地引起人们的关注,争夺量子领域的制导权已上升到国家战略层面。量子技术主要包括量子信息、量子计算、量子模拟和量子探测等领域,其主要平台有超导电路,量子点,NV色心,核磁,冷原子,离子阱系统等。本论文主要讨论量子声学在量子信息处理中的应用和基于Jaynes-Cummings格点模型的量子模拟。