论文部分内容阅读
基于最大似然估计的验证性因素分析,前提假设是数据是连续变量,并且服从多元正态分布。但是在实际的研究中,这些条件是很难保证的。在本研究中,考察了数据的不同类型,包括正态连续变量、分类变量和非正态的连续变量三种情况。三个研究分别在基于不同的数据类型,考察样本量、估计方法等因素对于验证性因素分析结果的影响。其中样本量取值范围从100到1000,数据类型涉及到正态连续变量、分类变量和非正态连续变量,估计方法考虑了GLS、ML、wLS(ADF)和S-B修正方法及Robust WLS等一些较新的估计方法。比较在这些不同的实验条件对于验证性因素分析模型识别率、参数估计和拟和指数的影响。研究结论如下:
1、在验证性因素分析中,对于正态的连续变量,估计方法我们应该选用ML和基于ML的S-B修正方法(MLM、MLMV)进行分析。
2、对于分类变量而言,如果将分类变量作为连续变量处理,即使分类数目较多,验证性因素分析的参数估计会不准确,得到的卡方和标准误也会偏大。因此,在研究中,对于分类变量应该将其标定位分类变量处理,并且选用WLS或者WLSM等适合分类变量的估计方法。其中,相对于WLS而言,Robust WLS(WLSM、WLSMV)得到的卡方值和标准误更为合适,对于模型的估计也更为准确。
3、分类变量的验证性因素分析需要较大的样本量,无论分类数目的多少,样本量都应该至少在200以上,如果分类数目较多,或者模型比较复杂,样本量应该在500以上。参数估计的精确性受到样本量的影响。
4、观测变量的分布形态会影响到验证性因素分析的结果。随着非正态程度的增加,模型的卡方值和标准误会增大,拟合指数会降低。在非正态数据的验证性因素分析中,ML和S-B修正方法是比较合适的估计方法。其中S-B修正方法会更为稳定一些。