成分数据中近似零点处理的修正EM算法比较

来源 :山西大学 | 被引量 : 3次 | 上传用户：ysabby2008

【摘要】

：

对于成分数据的处理往往是进行对数比变换，这时，如果数据中含有零点或是近似零点，变换后就会出现负无穷的数据.因此，对于成分数据中零点或是近似零点的处理就成为成分数据分析中

【作者】

：

常王华

【机构】

：

山西大学

【出处】

：

山西大学

【发表日期】

：

2013年01期

【关键词】

：

近似零点修正EM算法线性回归分析均值插补法成分数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

对于成分数据的处理往往是进行对数比变换，这时，如果数据中含有零点或是近似零点，变换后就会出现负无穷的数据.因此，对于成分数据中零点或是近似零点的处理就成为成分数据分析中的一个重要的课题，文献[12]中采用了基于线性回归的修正EM算法，本文将此方法进行了改进，分别是基于均值插补与基于Bootstrap方法上的修正EM算法，这两种方法均是在迭代的初值给定步骤进行了改进.模拟研究和实证研究对上述提到的三种方法进行了比较，结果显示本文方法相比原有的修正EM算法，算法更为简便，得到的估计更为精确.此外，针对上述分析结果，本文还研究了成分数据数据间相关性以及成分数据数据集不同缺失率对于缺失值处理方法选取是否有影响.　　论文由六章组成.　　第一章，主要介绍了成分数据和成分数据中近似零点处理的修正EM算法的研究背景及意义.　　第二章，主要介绍了国内外研究现状以及已有的一些方法.　　第三章，系统的介绍本论文所用的两种方法.　　第四章，主要通过模拟数据，分别从收敛性概率、补全数据与缺失数据的距离误差和标准误差三个方面出发，对成分数据中近似零点处理的三种修正EM算法的效果进行了比较，并且深入探讨了数据间的相关性以及缺失率对三种修正EM算法的影响.　　第五章，主要做了三个例子，分别采用三种修正的EM算法对岩石构成的成分数据、地质学成分数据和55-64岁男性体重指数所占百分比的成分数据中的近似零点或零点数据进行补全，验证是否与上一章模拟的结果相吻合.　　最后一章.主要针对全文研究的方法作一个总结.提出问题和展望.

其他文献

优势关系粗糙集的扩展模型及快速约简方法

在基于优势关系的粗糙集理论中,优势关系要求“对象x优于y当且仅当对象x在每个属性上均优于对象y”。当属性个数较多时,这种优势关系的定义会导致对象的优势集偏小,影响到规

学位

粗糙集优势关系变精度粗糙集正域逼近快速约简

q-形变3-李代数

本文主要研究了q-形变3-李代数的结构、表示,以及q-形变3-李代数的Hom结构问题。q-形变3-李代数简称为q-3-李代数。内容如下：给出了q-3-李代数及I-型 q-3-李代数的定义，对其结

学位

拓扑群论3-李代数代数结构q-形变

A novel approach to investigate effect of magnetic field on dynamic properties of natural rubber bas

The preparation of natural rubber based isotropic thick magnetorheological elastomers (MRE) was focused on by varying the percentage volume concentration of car

期刊

magnetorheological elastomernatural rubbercarbonyl iron powder (CIP)dynamic a

图的κ限制边连通性

人们通常用图做为数学模型表示多处理机系统的互连网络拓扑，其中图的顶点表示处理机，边表示一对处理机之间的直接通信联系，从而可以通过图的性质来度量网络拓扑的性能.网络的可

学位

连通图κ限制边超级尼-限制边度条件

电信与互联网的竞合

关于电信与互联网的关系问题,电信专家更多地强调的是电信网的完美功能和光明的发展前景;互联网的同行则热衷于颂扬网络的无处不在,无所不能.两派专家一直争得不可开交,谁都

期刊

电信网互联网竞争专家行业发展相互融合合作伙伴主旋律网络时代规则功能

聚合风险模型下的保费估计及信度估计的推广

在非寿险精算中,聚合风险模型是一种非常重要的数理模型,它描述了一段时间内某种保单的总索赔额。由于聚合风险模型的总索赔额的涉及到索赔次数和索赔额等多个随机变量的联合分布。求解聚合风险模型总索赔额分布是非寿险精算中的一大难点问题。因此,建立合适的聚合风险模型并对相关的保费进行估计是非常有意义的。本文重点讨论了聚合风险模型下的保费估计问题。一方面从统计上得到聚合风险模型在各种保费原理下的保费估计,得到相

学位

贝叶斯估计信度估计聚合风险保费原理经验估计分层混合效应线性模型

零度为1的双圈图刻划

设G是一个简单无向图，它的顶点集记为V(G)={v1,v2,… vn}。图G的邻接矩阵为A(G)，它是一个n×n阶实矩阵{aij}n×n，当vi邻接于Vj时，aij=1，否则，aij=0。图的零度是指图的邻接矩阵的0特

学位

双圈图零度研究邻接矩阵

田园畲家农耕如画

浙江省景宁县吴布村是全国唯一的畲族自治县，该县至今依然保留着许多古老的习俗。眼下正值当地梯田耕作时节，村内房前屋后，竹园丛中，处处可见畲族村民的劳作情景。

期刊