论文部分内容阅读
在统计学中影响统计结果的重要因素有两个:一是观测数据,二是对总体某些特性(分布、独立性等)的假设.当观测数据中存在一些不能很好的代表总体的异常点或者研究总体不满足一些传统的统计方法对总体某些特性的假设时,就会出现问题甚至导致错误的结论.这个时候,一些更为稳健的统计方法、更为稳健的分布类型更能体现出在处理这类问题上的优势,t分布、Laplace分布、Pearson type Ⅶ分布等一些包含异常点的"厚尾分布"对异常值和偏离均值较多的厚尾数据都不是特别敏感,是一种很不错的稳健分布类型,同时也体现出了稳健统计方法的特点:即使存在少量异常点,对与理想分布的偏离所引起的结果影响也不是很大;存在较多的异常点也不至于导致错误的结论.随着社会的发展,我们生活中各个领域的数据也越来越复杂、多样,这时势必要对这些异质的总体进行聚类分析,混合模型应运而生,用不同的参数和比例的分布来拟合不同的几类数据.大量异方差数据的存在违背了传统回归模型中方差齐次性的假设,为了有效的控制方差,在处理异方差数据的问题上,我们多采用联合均值与方差模型,现在我们也可以将模型方法进行推广,使适用范围更加广泛,把同质总体中的联合均值与方差模型推广到异质总体的混合模型中.进一步地,当考虑混合数据的分类情况未知时,我们还可以引入混合专家系统,对混合比例进行建模,应用Logistic回归对影响混合比例的未知参数进行估计.本文主要基于t分布、Laplace分布、Pearson type Ⅶ分布三种稳健的分布应用EM算法对异质总体的混合联合位置与尺度模型的未知参数进行极大似然估计,主要内容有:第一,基于t分布下,建立混合联合位置与尺度参数的模型,应用EM算法、极大似然估计、Gauss-Newton迭代算法对模型中的未知参数进行估计,并通过Monte Carlo模拟方法验证所提出估计方法的有效性.然后试着把所提出的估计方法与实际生活联系起来,解决一些实际问题.第二,基于Laplace分布下,建立混合联合位置与尺度参数的模型,应用EM算法、极大似然估计、Gauss-Newton迭代算法对模型中的未知参数进行估计,并通过Monte Carlo模拟方法验证所提出估计方法的有效性.然后试着把所提出的估计方法与实际生活联系起来,解决一些实际问题.第三,基于Pearson type Ⅶ分布下,建立混合联合位置与尺度参数的模型,.应用EM算法、极大似然估计、Gauss-Newton迭代算法对模型中的未知参数进行估计,并通过Monte Carlo模拟方法验证所提出估计方法的有效性.然后试着把所提出的估计方法与实际生活联系起来,解决一些实际问题.第四,基于Laplace分布下,在混合专家系统中,建立混合联合位置与尺度参数的模型,应用MM算法、EM算法、极大似然估计、Gauss-Newton迭代算法对模型中的未知参数进行估计,并通过Monte Carlo模拟方法验证所提出估计方法的有效性.然后试着把所提出的估计方法与实际生活联系起来,解决一些实际问题.