论文部分内容阅读
社会是一个具有分层结构的整体,因此具有层次结构特征的数据在社会研究中广泛存在,为了更加准确的处理此类数据,多水平模型作为一种新的统计模型应运而生。多水平模型不仅能够同时处理不同层次,跨层次变量之间的关系,而且能够探讨各层次单位特征对被解释变量的影响,对不同水平之间的误差项进行综合考虑,进而对各个水平上的差异进行估计。混合线性模型是一种既包含固定效应(FE)又包含随机效应(RE)的重要统计模型,由于它只保留了一般线性模型被解释变量正态性的假定,不需要独立性以及齐方差性的假定,并允许各解释变量间存在相关性和异方差性,所以在层次结构数据、重复观测数据等许多实际数据中特别适用。多水平模型可以看作是一类特殊的混合线性模型,当将多水平模型的各个层次汇总成一个总模型后,多水平模型就具有了混合线性模型的形式及特征。在处理实际问题时,我们首先需要解决的就是模型选择问题,而变量选择作为模型选择的一种重要手段,是统计分析与推断中的重要内容。变量选择问题的研究由来已久,随着统计理论方法和计算机技术的不断发展、进步和完善,变量选择的方法逐渐增加并已有较多成熟的变量选择准则。但是大多数变量选择方法的研究都是基于传统的线性模型,对混合线性模型尤其是多水平模型变量选择问题的研究比较少,亦或在混合线性模型的变量选择上不能同时进行固定效应和随机效应的变量选择,而且无论固定效应部分还是随机效应部分的结构发生变化,都会使得另一部分的变量选择结果出现较大差异。本文根据混合线性模型的特点,将多水平模型改写成混合线性模型形式,然后对混合线性模型运用改进的基斯分解(Cholesky decomposition)方法进行分解,基于在似然函数中增加罚函数项的Lasso(Least absolute shrinkage and selection operator)方法,对多水平模型同时进行变量选择和参数估计。最后将该方法应用于红河州农户数据中,对农户人均收入进行实证分析,从而使多水平模型的理论及应用更加完善、全面。