论文部分内容阅读
对于成分数据的处理往往是进行对数比变换,这时,如果数据中含有零点或是近似零点,变换后就会出现负无穷的数据.因此,对于成分数据中零点或是近似零点的处理就成为成分数据分析中的一个重要的课题,文献[12]中采用了基于线性回归的修正EM算法,本文将此方法进行了改进,分别是基于均值插补与基于Bootstrap方法上的修正EM算法,这两种方法均是在迭代的初值给定步骤进行了改进.模拟研究和实证研究对上述提到的三种方法进行了比较,结果显示本文方法相比原有的修正EM算法,算法更为简便,得到的估计更为精确.此外,针对上述分析结果,本文还研究了成分数据数据间相关性以及成分数据数据集不同缺失率对于缺失值处理方法选取是否有影响.
论文由六章组成.
第一章,主要介绍了成分数据和成分数据中近似零点处理的修正EM算法的研究背景及意义.
第二章,主要介绍了国内外研究现状以及已有的一些方法.
第三章,系统的介绍本论文所用的两种方法.
第四章,主要通过模拟数据,分别从收敛性概率、补全数据与缺失数据的距离误差和标准误差三个方面出发,对成分数据中近似零点处理的三种修正EM算法的效果进行了比较,并且深入探讨了数据间的相关性以及缺失率对三种修正EM算法的影响.
第五章,主要做了三个例子,分别采用三种修正的EM算法对岩石构成的成分数据、地质学成分数据和55-64岁男性体重指数所占百分比的成分数据中的近似零点或零点数据进行补全,验证是否与上一章模拟的结果相吻合.
最后一章.主要针对全文研究的方法作一个总结.提出问题和展望.