论文部分内容阅读
在通常的Bayes框架下把某个未知函数作为参数并赋予一个先验分布,就成了所谓的非参数Bayes分析。非参数Bayes分析最核心的问题是为函数型参数构造先验分布。这相当于在相应的函数空间上构造一个概率测度。众所周知,构造无穷维空间上的概率测度是一个非常困难的问题。在非参数Bayes分析领域,据我们所知,Dirichlet过程是迄今为止这方面唯一的结果。令M(θ)为θ上所有的概率测度组成的集合。所谓θ上的Dirichlet过程D(α)实际上就是M(θ)上一个特殊的概率测度,其中α是θ上的有限测度,它也是先验分布D(α)中的超参数。在经典Bayes分析中,除正常先验以外还有所谓的非正常先验。非参数Bayes分析存在类似的问题。比如,在无穷个成分的混合正态模型中,权重向量是N上的概率测度。如果先验知识告诉我们权重向量的各个分量大致上与N上的某个有限测度α成正比,我们就可以用N上的Dirichlet过程D(α)作为权重向量的正常先验。但是,如果我们没有关于权重的任何先验知识,采用D(α)作为先验分布就不合适了。为了解决这个问题,我们对N上任何σ有限测度α,定义了Mσ(N)上的一个概率测度G(α),其中Mσ(N)是N上所有σ有限测度组成的集合。因为G(α)与Gamma分布有密切的关系,我们就把这个测度叫做N上的Gamma过程。当α是有限测度时,G(α)经过适当的规范化就成了Dirichlet过程D(α).因此,我们的结果推广了经典的Dirichlet过程理论,并且可以用作N上未知分布(如上面的权重向量)的非正常先验。
我们把N上的Gamma过程理论用于无限个成分的混合正态模型(下文简称为无限正态混合模型)的Bayes分析。Rasmussen在2000年的一篇论文中讨论了这个问题。他的出发点是m个成分的混合正态模型,其中权重向量的先验取Dirichlet分布D(α/m,α/m,…,α/m).令m→∞,所得到的参数更新公式就是该作者的最终结果。直观上,当m→∞时Dirichlet分布D(α/m,α/m,…,α/m)的极限是α取N上均匀分布时的Dirichlet过程。然而,Dirichlet过程理论要求超参数α是有限测度,而非一般的σ有限测度(如N上的均匀分布)。我们采用Gamma过程作为权重向量的先验。这为Rasmussen的方法建立了理论基础。
最后,为了验证本文的方法的有效性,我们做了两组实验。在第一组试验中,我们用无限正态混合近似已知的分布(它们分别是t分布、非中心F分布和Beta分布);第二组实验是把无限正态混合用于基金净值数据。