论文部分内容阅读
随着社会的不断发展、计算机储存能力的增强,人们对问题认识的深入、要求的提高,如何在大量的数据中发现有用的信息、模式和知识成为了焦点问题,传统的单一分布很难有效地解决这个问题。为此,人们提出了混合分布模型,混合分布模型作为模拟观察数据的一个有效工具可追溯到1984年,在最初的几十年间,发展比较缓慢。现在由于计算机技术的进步和统计计算技术的发展,混合分布模型已成为分析复杂现象的一个重要工具并在各个领域如:生物、医学、经济、金融、环境科学及工程等领域得到广泛应用。 本文介绍了混合分布模型发展和研究现状,不同的混合分布模型(混合泊松分布模型、混合指数分布模型、混合正态分布模型1的性质及应用条件。其中混合泊松分布在医学领域有广泛应用;混合指数分布在工程领域里有一定应用;而混合正态分布应用最广,因为许多随机现象在样本量足够大时都可以用正态分布逼近。 本文主要讨论了混合分布的参数估计以及置信区间的估计。本文有以下几个部分,第一章介绍了混合分布的发展和研究现状以及还有哪些方面有待研究。第二章考虑混合泊松分布模型,分别用矩估计法、聚类法、EM算法对不同情况下的混合泊松分布模型的参数进行估计。考虑用EM算法得到的参数估计值的置信区间估计,即用Louis算法得出参数估计值的渐近方差的Fisher信息矩阵,由此得出参数的区间估计。第二章讨论混合指数分布的参数估计问题,分别用矩估计法、贝叶斯估计法、EM算法、聚类法对不同情况下的混合指数分布的参数做估计和比较。第四章我们用贝叶斯估计法、聚类法、EM算法得出混合高斯分布模型的参数估计,并考虑多维混合高斯分布的参数估计问题。介绍当混合元个数未知的情况下,如何改进EM算法的问题。