基于贝叶斯方法的高斯图模型若干问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lyfqxx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来高斯图模型被广泛地应用在各个社会和科学领域,来描述变量间的条件独立结构,包括经济学、基因学以及社交网络.一般的高斯图模型主要针对简单的数据,然而在一些特定的应用中,数据具有复杂的结构化信息,例如分组信息,聚类信息,以及时变信息.由于贝叶斯方法能够较好地利用先验信息,本文采用贝叶斯方法来学习具有结构化信息的高斯图模型.相比于传统的采样方法,本文使用EM(expectation maximization),变分EM方法来进行后验推断,具有较快的收敛速度.本文主要贡献如下:(1)提出了一种新的贝叶斯方法来学习引入分组信息的高斯图模型.首先为精度矩阵中的对角元素引入spike and slab先验和NEG(normal exponential gamma)结构化先验,模型能够获取全局稀疏性和组稀疏性.并且使用确定性的EM算法来进行后验推断.然后,通过引入分层先验来学习具有重叠块的高斯图模型.并且使用变分EM算法来进行后验推断.仿真结果表明,与现有方法相比,该方法能够以更小的估计误差估计稀疏的图结构.最后我们使用股票价格和基因表达这两组数据来应用我们方法.(2)提出了一种新的贝叶斯方法来进行高维数据聚类,同时学习稀疏的多类高斯图模型.与之前大多数假设聚类信息已知的多图学习方法不同,我们为聚类标签引入多项分布先验.首先,为精度矩阵引入joint spike and slab graphical Lasso prior,来获取稀疏性,并且在异质的图模型中自适应地学习同质性.另外,通过引入结构化马尔科夫随机场先验,该方法能够聚类具有网络连接的数据,不需要样本独立假设.最后采用快速EM算法来进行后验推断.与现有的方法相比,该方法无论是在聚类误差上还是图结构选择上均具有显著的提高.通过模拟实验和实际数据分析可以说明该方法的优势.(3)提出了一种新的贝叶斯方法来学习时变高斯图模型.首先通过引入混合spike and slab高斯先验和图拉普拉斯先验,来获得稀疏性以及自适应性.通过引入同质性指示变量,模型能够发现图模型中结构的突变点.然后采用ECM(expectation conditional maximization)算法来进行后验推断,在E步中采用变分推断来近似期望,在CM步中,优化问题可转化为线性状态空间模型通过卡尔曼滤波方法快速求解.最后通过实验分析和实际数据来说明模型的表现.
其他文献
考察当下网络舆情事件的生发和演化规律可以发现,同类舆情事件之间呈现出类似物理学中“共振”的一些特征,同议题、同主体、同情绪等多起舆情事件往往被联想、关联到一起,使孤立发生的单一舆情事件演化为具有某些相同特征的舆情事件簇和事件集,形成舆情共振现象。作为网络舆情中的一种特殊现象,舆情共振一方面能够凝聚社会共识,弘扬社会正能量,提升社会认同感、民众自豪感;另一方面也给社会和谐稳定、经济健康发展和网络空间
铝合金轮毂作为车辆行驶系统中的重要承载部件,在汽车轻量化方面做出了重要贡献,已经在民用、特种作业和军事等领域获得了广泛应用。汽车轮毂不仅要有足够的整体强度、刚度,还需要具有良好的表面性能。然而,铝合金轮毂表面的强度、硬度低,耐磨性差,在高盐、湿热等环境下的抗腐蚀能力不足,这大大缩短了它的服役寿命,限制了其作为重型货车和特种车辆轮毂在恶劣环境下的应用。因此,通过采用表面处理方法来改变铝合金表层组织结
可移动永磁磁共振牺牲一定灵敏度,无需冷却液,相比于超导式磁共振具有购置成本低、检测成本低以及维护成本低的优势。此外其可移动的特性将磁共振应用从专门的超导实验室扩展至食品安全、药物检测、石油勘探等应用场景。对于永磁磁共振成像仪和波谱仪,磁场的均匀性直接影响信号的质量,高均匀度磁体研究是系统研发的难点和热点;对于永磁磁共振弛豫计,一个结合场景应用需求,新颖、高效的磁体设计是仪器研发的重点。本文将从磁体
潜在的有毒元素,如重金属,由于其致癌性,已经成为生态系统的潜在威胁。重金属是土壤中重要的污染物之一,其在土壤中的含量、赋存和迁移转化直接影响食品质量与安全,进而对人体健康构成严重威胁。对土壤重金属的固化、稳定和修复是当前土壤污染治理的研究热点。修复土壤重金属污染,适宜的材料研发是固化稳定土壤重金属的关键。近年来,生物炭作为一种环保经济且官能团丰富、孔隙结构优良的碳材料,其用于土壤污染修复和质量改善
切割是一个表面简单实质复杂的过程,尤其当切割对象属于纤维类材料时切割问题的复杂程度更高,原因在于切割对象结构组成的复杂性和多样性。单纤维通过机械编织形成登山绳、安全索和防护服等机械复合体,纤维的机械复合体失效往往导致生命财产安全问题,因此要求具有较高的抗切割能力;单纤维通过自然生长形成农作物茎秆等植物复合体,我国茎秆产量巨大,作为茎秆清洁化再利用第一步骤的切割或切碎浪费了大量的能源。然而近几十年来
同声传译在源语言说话人表述过程中同步进行翻译,显著改善了跨语种沟通交流的效率。随着通信、互联网技术特别是移动互联网的迅速发展,全球化沟通的日益频繁,跨语言沟通交流成为日渐普遍的基本需求。作为最快捷方便的语音翻译方式,同声传译有着广泛的应用。受限于人工同传译员培训困难、工作强度大等问题,人们对于基于计算机的自动同声传译的需求日益明显。因此,面向同声传译的自动语音翻译成为当前机器翻译研究的一个重要方向
面对日益庞大的老龄群体和严峻的老龄化形势,我国现有的养老服务体系正在作出优化升级的一系列实践。在此背景下,重视养老技术的智化转型与智慧技术融入,使现有的传统养老理念、模式和技术运用等发生了深刻的变革,老年群体的自我认知、社会对老年群体的认知、老年群体的产业与社会价值等各方面正在被重新定义和演绎,建立数字创新环境下的新型智慧化养老模式优化方案已成为研究的热点。面对这一问题,本文以微观需求视域下智慧康
哺乳动物的基因组在细胞核内经多层级有序组装,在空间结构上压缩了近一百万倍,形成了染色质高级结构。染色质高级结构的建立和动态变化,对基因的表达调控和细胞命运决定都至关重要。近年来,关于染色质拓扑结构域的研究已有诸多报道,但对不同物种间更保守的A/B区室结构是如何建立和维持的,仍不明确。众所周知,氨基酸序列决定蛋白质的结构,类似地三维基因组结构很可能也受到DNA序列的影响。人类基因组中仅有1%的区域编
2008年5月12日14时28分,突如其来的特大地震袭击了汶川,5·12汶川特大地震(后文简称汶川地震)作为过去发生的事件,自动生成为历史。伤亡惨重的汶川地震将成为国人永远抹不去的记忆,对于如此重大的创伤性公共事件,建构一个对于这一历史事件的集体记忆,无论是对于遇难者、同时代的个人还是我们的后代和国家都是极为必要的。如何建构这一历史事件的集体记忆?谁来建构?记忆什么?第一章认为,集体记忆在很大程度
本文在搜集中华人民共和国成立初期浙江美术发展史料基础上,从美术家群体组成与身份变化、新图式的形成与传播两个方面,探讨1949-1956年间,浙江美术家在中央统一的政策和管理之下,如何通过论争、重组和建设,缔造了浙江美术新生态的过程,说明新中国美术图式的改变,是构筑一个符合国家整体动员能力的美术新秩序的历程。文章认为,浙江美术在新中国成立之初的主题是秩序重构。浙江美术新秩序的形成,是以“重构”为中心