论文部分内容阅读
目的:对比结构方程模型中的ML、GLS、WLS三种参数估计方法的性能,总结各种方法在不同数据特征条件下的优劣,为更加准确地运用结构方程模型解决实际问题提供科学依据,为推广结构方程模型的应用提供方法支持。
方法:采用蒙特卡罗数据模拟方法实现具有不同数据特征(样本含量、数据分布类型和变量间的相关系数)的多变量数据的模拟,依据模型的原理和算法,设定了20个显变量和5个潜变量的全模型的真模型和误设模型,采用SAS CALIS过程对模型进行拟合,利用拟合指数评价模型的拟合效果,并对比三种方法的两类错误频率。
结果:在设定了每个潜变量所对应的4个显变量间的相关系数分别是0.3、0.5和0.7三种相关系数的条件下,无论数据是否为多元正态分布,无论是采用相关系数矩阵还是协方差矩阵,三种方法的两类错误频率均随相关系数或样本含量的增加而呈现下降趋势;ML法的第一类错误频率在各种条件下均小于0.05,但其第二类错误频率在样本含量达到400即显变量个数的20倍或近似为自由参数个数的10倍时已均小于0.10,在样本含量、相关系数及矩阵选择相同时,其正态分布的两类错误频率之和最小,轻度偏态分布的次之,而重度偏态分布的最大:GLS法表现为第一类错误频率较大而第二类错误频率较小,三种分布样本含量达到200时第二类错误频率便可小于0.05,而第一类错误频率只有在样本含量达到1000时才近似小于0.05;WLS法与GLS法类似,其第二类错误频率几乎均为0,但第一类错误频率较大,在数据特征条件相同时其相关系数矩阵的第一类错误频率小于协方差矩阵的第一类错误频率。
结论:三种方法中ML法是相对稳定且值得信赖的参数估计方法,其第一类错误频率在各种条件下均小于0.05,其两类错误频率之和受数据分布类型的影响相对较大,多元正态分布最小,若增大样本含量或增大显变量间的相关系数时,ML法对多元非正态分布数据的参数拟合效果也很理想;GLS法和WLS法则表现为第一类错误频率较大但第二类错误频率很小,且对数据分布类型的敏感性相对较小;在数据特征相同的条件下,两类错误频率之和在相关系数矩阵中表现为ML法最小、WLS法次之、GLS法最大,但协方差矩阵则表现为ML法最小、GLS法次之、WLS法最大;虽然WLS法被公认为不受数据分布类型的影响,但因其所需迭代次数过多,易造成拟合函数不收敛,且其相关系数矩阵的第一类错误频率要小于协方差矩阵。