贝叶斯非参数先验的若干应用

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:qinlou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯非参数统计是一个相对年轻并且发展速度比较快的一个统计领域,它不仅产生了大量的理论成果,而且被广泛的应用到各种实质的领域和方向中。相比于传统的频率学派下的非参数统计,贝叶斯非参数是在贝叶斯框架下,基于它的后验或者预测分布来进行统计推断的。而相比于参数贝叶斯,贝叶斯非参数是建立在分布空间上的先验并且具有很大的支撑空间,而传统的参数贝叶斯只是基于参数空间建立的。尽管贝叶斯非参数在实际应用中面临着很多的挑战特别是计算的难题。在很早以前由于受到计算上的困难,人们只是基于对贝叶斯非参数理论的研究。幸运的是随着近年来计算机和如MCMC类似的数值分析的发展,贝叶斯非参数统计被广泛的应用于实际问题的研究中或者利用贝叶斯非参数模型来分析更加复杂的数据。其中常用的贝叶斯非参数先验包括Stick-breaking过程先验,Dirichlet过程先验,Pitman-Yor过程先验以及Polya tree先验结构等等。本文主要讨论了一般的Stick-breaking过程先验及其性质,分别讨论了在Dirichlet过程先验下的保费厘定问题,由混合Polya tree拟合的带有共同影响的贝叶斯费率的厘定以及基于混合多维Polya tree下的Copula函数估计问题。本文的主要内容如下:首先,在第一章中,我们对贝叶斯非参数统计进行一个全面的回顾,包括:人们为什么使用贝叶斯非参数统计,三种不同的贝叶斯先验,以及其简要的历史发展,其丰富的理论成果和实际应用。我们以回顾一系列文献的方式,阐述了贝叶斯非参数统计中的计算问题、未来的研究方向和可能面临的挑战。在第二章,我们基于Sethuraman(1994)提出的关于Dirichlet过程先验的另外一种形式(Stick-breaking形式)下,讨论两种新的形式的Stick-breaking过程先验,这两种形式分别是在假设Stick-breaking比率为同一分布族和不同分布族情况,其中就包含了两个已知的过程先验:Dirichlet过程先验和泊松Dirichlet过程先验。并且我们讨论了这些情况下的贝叶斯先验的一些理论性质。这些先验非常灵活,产生很多的不同先验模型结构。我们讨论了对一般的Stick-breaking过程后验计算的三种不同的有条件方法,最后我们提供一个数值模拟来说明这三种方法。第三章研究在不同误差函数下,基于索赔服从一定的参数分布族并且假设其参数分布中的风险参数是基于Dirichlet过程先验结构下的贝叶斯保费计算的问题。我们假定风险参数服从Dirichlet过程有两个优点:第一,基于一般误差函数下的这一类保费准则下,可以产生准确的贝叶斯经验保费,其次可以提供稳健灵活的方法避免由传统的先验如无信息先验或者共轭先验下产生的偏差。本章中我们基于Dirichlet混合模型下研究贝叶斯经验费率厘定问题,但是由于缺少有关条件期望的易于分析的形式,我们通过设计吉布斯抽样方案来去近似它们。在第四章中我们研究在贝叶斯非参数框架下基于Polya tree先验在不同误差函数下的经验费率厘定的问题。我们知道在通常情况下,贝叶斯方法是假设数据服从一个特定的参数密度,其中假设参数被分配到一个结构函数来反应先验信息。但是,在实际问题中,我们所分析的信息不能够充分的提供完全确定的先验结构。因此我们很自然的基于贝叶斯非参的方法来假设风险参数服从Polya tree先验。但是后验分布和风险参数的条件期望的计算会变得相当复杂,因此我们通过MCMC方法来获取贝叶斯保费的数值解。最后我们用数值模拟来表明基于有限Polya tree先验结构比参数贝叶斯模型更加优越。第五章研究了使用贝叶斯非参数的方法对Copula函数的估计问题,其中Copula函数刻画了多个变量的相依性,是连接联合分布和他们的边际分布的函数。我们使用多维的Polya tree模型,它可以处理那些非标准特征的数据。我们通过使用MCMC的方法来克服计算难题,特别是当我们用多维的Polya tree模型去刻画高纬数据集的时候。我们通过一个关于高斯分布的数值模拟来评价我们所提的方法,其中包括独立和同单调两种情况。最后我们使用我们的方法来分析上证指数和深证指数之间的相依性。
其他文献
角萼苔属(Ceratolejeunea)属于细鳞苔科,主要分布于热带地区,目前世界已接受的有47种1亚种。该属个体微小难以被采集,作为重要分类特征的油胞与油体又易解体,导致角萼苔属的分类鉴定比较困难,很多类群的划分颇具争议,迄今为止也没有全球范围内角萼苔属的分类修订。随着全球气候变化与生态环境的日趋恶化,全球热带雨林面积大幅减少,主要生存于热带的角萼苔属植物也备受威胁。因此,作者运用分子系统学和形
二维矩形条装箱问题(Two-Dimensional Strip Packing Problem,2D-SPP):给定矩形条的宽度W固定,高度H不固定,以及一组小矩形{(w1,h1),(w2,h2),...,(wn,hn)},其中小矩形宽度为wi,高度为hi,1≤i≤n,0≤hi,0
近年来,放化疗及手术等治疗手段广泛应用于恶性肿瘤的治疗,但这些常规治疗手段常常会伴随一定的副作用,在这种情况下,亟需开发更多的肿瘤治疗方法。其中,免疫疗法中的抗体类药物以其特异性、靶向性、多样性等众多优势被广泛地运用在肿瘤的治疗中。经典的抗体结构包含重链恒定区(CH)、重链可变区(VH),以及轻链恒定区(CL)、轻链可变区(VL),分子量大小在150k D左右。虽然抗体药物在临床上取得了一定的研究
码头作为交通运输的枢纽,对促进经济发展有着重要的作用。随着信息技术的快速进步,码头的自动化和智能化已成为发展趋势。本文研究码头智能化中的泊位分配问题,该问题是组合优化问题中带状二维装箱问题的变形。本文第一章按港口空间布局介绍了码头中几个重要的优化问题,按照岸线空间因素对离散、连续和混合型三种泊位分配问题进行了文献综述。本文第二章在考虑了装卸货物属性和船只种类等因素的条件下,研究了受单向航道约束的连
餐厨垃圾是一类高含水率、高有机质的湿垃圾,且极易腐烂、滋生蝇虫。如何对其进行高效化、资源化、无害化处理亟需深入研究。相关研究表明,餐厨垃圾生物处理方法,尤其是微生物菌剂的接种,有望成为一种可持续的餐厨垃圾处理方式。为研发用于餐厨垃圾生物处理的高效微生物菌剂,本研究通过分离得到大量高温菌株,经产酶能力的比选获得高效菌种,将这些高效菌株通过正交实验确定降解餐厨垃圾的最优菌种组合,制备得到高效复合微生物
各种环境胁迫均会使内质网(Endoplasmic reticulum,ER)的稳态失调,导致内质网胁迫(ER stress)的发生。胁迫下被诱导激活的未折叠蛋白质反应(Unfolded protein response,UPR)可通过减少内质网中错误折叠的蛋白质积聚来维持细胞存活,而内质网胁迫过于严重时,UPR则促进程序性细胞死亡(Programmed cell death,PCD)的发生。动物细
单光子态在量子信息处理、量子通讯以及量子计算等领域的应用前景非常广泛,因此其已经成为量子光学领域最重要的研究对象之一。单光子可以由不同的介质系统产生,比如NV色心、原子气体、量子点、单原子及单分子等。但是无论是由何种源产生的单光子,都需要测量单光子态的品质,比如线宽,谱线明亮度,单光子纯度,不可分辨率,态密度矩阵等。本文所研究的单光子态是在85Rb冷原子系综中通过四波混频过程产生的宣布式单光子源。
在当前“传统复归”的社会思潮和弘扬优秀传统文化的国家政策背景下,传统文化复兴及其儒学建设,已经成为具有当代中国文化特征的社会行动与文化景观。这主要表现在思想文化层面的分歧与论争,社会实践中的多元主体及其不同实践取向,以及儒学复兴中的“制度性焦虑”和“神圣性危机”。上述特征彼此交错且关联密切,形成了儒学复兴的社会学问题。儒学复兴的社会行动包括观念认知、仪式表达、社会行动、制度安排、神圣建构等一整套形
突触可塑性是学习记忆的重要机制,其主要包括长时程增强(long-term potentiation,LTP)和长时程抑制(long-term depression,LTD)。LTP在时间上分为早期LTP和晚期LTP。早期LTP主要涉及蛋白质的翻译后修饰,而晚期LTP则需要蛋白质的重新合成。已有大量研究表明磷酸化修饰参与了早期LTP的发生,而其他类型翻译后修饰在早期LTP形成中的作用还知之甚少。本课
基因转录的精确调控对于生物体的生长发育至关重要,也与疾病的发生发展密切相关。发生在DNA胞嘧啶上的甲基化修饰,即DNA甲基化,是一种重要的参与基因转录调控的表观遗传修饰。位于基因启动子区域的DNA甲基化修饰常与转录抑制相关,然而关于全基因组范围内启动子区域DNA甲基化如何影响基因转录及其精确的分子机制和生物学意义仍然没有被完全理解。DNMT3家族蛋白的ADD结构域能够识别并结合未甲基化修饰的H3(