基于贝叶斯有限多元混合厄朗模型的特征选择

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zhbcaq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有限混合模型在聚类和分类中有着重要的作用,是聚类重要方法之一,可以用来处理多个混合分布类型的数据。基于混合模型的应用十分的广泛,但也存在一些问题。比如应用最广的EM算法进行参数估计时会对初始值很敏感,传统的聚类方法如K均值聚类、层次聚类法等无法获得聚类特征重要性。尖顶平板最早被提出来是在线性回归中做特征选择,也可以用于混合模型中。在此情况下,本文选用有限混合模型同时进行特征选择,采用贝叶斯方法获得参数估计和聚类情况,避开了对初始值的依赖。对于后验分布则利用贝叶斯方法通过MCMC(Markov chain Monte Carlo method)抽样获得。对于特征变量,我们引入特征重要性指示变量,并对每个特征设置一个尖顶和平板类型的先验,再通过后验MCMC迭代计算其特征重要性程度。混合厄朗模型被证明在非负连续多元空间上是稠密的,作为混合伽马模型的特例,适用于非负性的正值多维数据,如保险精算、医学实验、工业生产等领域。本文选用具有共同速率的有限混合厄朗模型进行参数估计,首先利用结合矩估计的一种K均值聚类算法CMM(Clustered Method of Moments)确定混合厄朗模型的速率参数、形状参数以及混合成分的初始值,再利用MCMC方法获取混合厄朗模型的贝叶斯后验估计,结合标签置换获得混合模型的参数估计。对于模型算法的可行性和效果,分别通过模拟实验数据和一个瑞士银行的真钞和假钞实例数据进行实证分析,并将参数估计结果进行拟合优度检验。
其他文献
本研究基于2005-2015年之间的中国综合社会调查(Chinese General Social Survey,CGSS)数据,运用stata17计量软件,利用probit模型和多元线性回归模型,实证分析了金融危机对就业人口/劳动年龄人口比率与年劳动收入的影响及该影响的性别差异,并探究了性别传统观念、职业行业、收入水平和户籍状况的影响特点。创造性地将金融危机作为一个冲击引入男女劳动力市场的研究。
学位
在多细胞组织中,为了实现组织更新,组织特异性干细胞会进行两种分裂模式:一种是对称分裂,另一种是非对称分裂。最近,学者们特别关注干细胞的分裂模式对癌症风险的影响,并多次报道对称分裂模式更有利于延缓癌症的发病。本文通过研究带有突变的随机干细胞分裂模型,比较了干细胞的非对称分裂和对称分裂模型的期望和方差。我们发现,非对称模型和对称模型的期望是相同的,但对称分裂模型的方差比非对称分裂模型的方差要大。进一步
学位
当代高分子力化学的一个主要需求是在合成材料中重现活体组织对机械力载荷各个方面的复杂响应。不论是活体组织还是合成材料,这两种类型的材料在机械力载荷下都会降解,但只有活体组织能够感知并发出这种损伤的信号,并触发其修复功能。合成材料中的损伤信号通常是通过利用力致变色,或通过材料由力引发的紫外吸收或荧光发射的变化来实现的。我们展示了一个分子间的级联反应,提高整个体系的交联引发力阈值,这个级联包括三个反应:
学位
平方根Lasso是Lasso的一种变体,它具有尺度不变性,不仅消除了对噪声标准差σ进行估计的需求,还放宽了对噪声服从高斯分布或亚高斯分布的要求.本文综合平方根Lasso和自适应Lasso的优点,在贝叶斯框架下考虑了一种全新的正则化方法——贝叶斯自适应平方根Lasso方法.利用Laplace分布可以表示成高斯分布的尺度混合分布的性质,推导出了所有未知量的全条件后验分布,并由此建立Gibbs抽样器算法
学位
本文以新型冠状病毒肺炎疫情为案例,通过动力学建模来探究新发传染病的传播特征。将人群总体分成五个部分:易感者S,潜伏者E,无症状感染者A,感染者I和恢复者R,首先建立了一类SEAIR传染病仓室模型,分别在连续时间和基于复杂网络的离散时间两种情形下研究了模型的动力学性质。运用Jury判据、Routh-Hurwitz判据及LaSalle不变集原理,对于连续模型当σm>αmγ+σβ时,模型只存在一个无病平
学位
肿瘤是一种长久以来严重危害人类健康的疾病。上世纪中叶以来,肿瘤干细胞理论备受关注,传统的肿瘤干细胞理论认为,肿瘤组织是层次化的,肿瘤干细胞具有最高的分化潜能,通过细胞分化生成下游的肿瘤细胞。但越来越多的研究结果表明存在逆分化现象,可将已经分化的肿瘤细胞恢复到肿瘤干细胞表型。为了研究逆分化现象,我们建立了一个带有逆分化机制的随机过程模型,此模型以肿瘤干细胞数量的变异系数为研究对象,观察变异系数随逆分
学位
图的zeta函数最早是由Ihara提出的,通过研究p-adic群,Ihara研究了正则图的zeta函数,后人称为Ihara-zeta函数.随后关于图zeta函数的研究层出不穷:Hashimo-to讨论了半正则二部图的zeta函数;Bass将正则图上的zeta函数推广到一般图上.他将一个无限乘积转化为一个与邻接矩阵和度矩阵相关的多项式,这是非常重要的结论,为得到一般有限图的zeta函数提供了简便的方
学位
阿尔茨海默病(Alzheimer’s disease,AD)是1907年德国精神病学家Alosis Alzheimer首先发现和报道的,是老年人常见的神经系统变性疾病。它的病理特征是神经纤维缠结和老年斑的形成,它们分别与tau蛋白过磷酸化和Aβ积累相关。关于阿尔茨海默症的发病机理有很多,比较常见的是β淀粉样沉淀假说,它认为脑内β淀粉样多肽(Aβ)聚集形成老年斑,老年斑具有神经毒性,进而引起神经细胞
学位
含金属高分子展现出令人意想不到的各种优秀性质,因此得到了人们越来越广泛的关注。碳龙配合物是全新的M?bius金属芳香化合物家族,存在各种独一无二的性质,其中包括近红外光热转换效应。热响应高分子是一类在温度变化刺激下能够做出响应性行为的高分子。本论文的目的在于将十二碳龙配合物的光热转换性质引入到热响应高分子中,制备功能独特的近红外光热响应含金属高分子。其中:第一章为绪论,主要介绍了与本论文相关的研究
学位
非线性光学晶体作为一种重要的信息功能材料,其先决条件是具有非中心对称的晶体结构。高效定向设计合成具有非中心对称晶体结构的化合物仍是当前研究的热点和难点。研究发现,具有立体化学活性孤对电子的阳离子(Bi3+、Te4+等)与阴离子配位时极易形成不对称的结构基元,能够显著增加化合物形成非中心对称晶体结构的几率。因此本文在磷酸盐基础上,通过引入Bi3+、Te4+阳离子,以期设计合成具有非中心对称晶体结构的
学位