论文部分内容阅读
广义线性模型是线性模型的推广,将随机误差项推广到了指数分布族,这样在处理数据时就更具有了灵活性、更具有广泛性。然而在实际问题中,一些变量的加入会导致随机变量不在独立,这就有悖于广义线性模型的基本假设。所以,这也就导致了再用广义线性模型处理具体问题的时候可能会忽略掉一些重要的变量,从而导致我们在处理实际问题中产生偏差,影响分析的结果。因此有学者将随机效应加入了广义线性模型从而建立了广义线性混合模型,这一举措大大的拓展了传统的分析领域。传统的分析政策满意度的方法中往往都是一些定性的分析,本文基于对传统分析方法的研究,结合前人的研究,通过广义线性模型和广义线性混合模型定量的分析了国民对当前政策的满意度。本文的数据来自于中国人民大学的“社会心态与政策评价关联”课题研究,此课题在全国范围内进行了问卷调查。将GLM、GLMM、PLS-logistic模型引入政策满意度评价领域,为满意度评价问题的研究提供了新的路径。本文主要内容如下:1.在详细的阐述了问卷的设计内容以及各选项的赋值情况下,通过对问卷数据的研究发现,这是一个典型的纵向数据,并且以往研究满意度评价的文献中有学者采用过普通logistic回归,这与广义线性模型具有很高的相似性。再加之广义线性模型的连接函数更多元化,不仅仅是把因变量划分为二元离散变量,因此考虑采用广义线性模型来分析满意度评价的问题。在基于GLM的分析中,选取了问卷中的部分具有代表性的变量如下:对我国当前收入分配满意度作为因变量,民族、户口、受教育程度、工作大单位作为自变量。并对自变量进行哑变量处理,把被调查者划分为60类人群,应用R软件,定量分析了这60类人们对政策的满意度情况,进行了分类排序,并分析了单个自变量对满意度的影响情况。从整体看来,国民对我国当前收入分配的满意度情况较为良好,但是还是表达出了国民希望国家在收入分配政策中进一步完善激励约束机制。并且分析发现受教育程度的高低,和满意度高低成正比,因此国家应出台相应政策提高国民的普遍的受教育程度。2.将家庭年收入作为随机效应构建满意度评价是合理的。从上一节分析发现,通过固定民族、户口、受教育程度这3项对应的自变量,研究不同工作单位人群的满意度,计算对比发现,在企业单位工作的人群以及离退休人员的满意度较高。联想到不同工作单位收入的高低不同,因此决定将家庭年收入作为一个随机效应加入到模型中。本节的自变量数据处理方式与上面的略不同(见表3.4),迭代100次后参数收敛,发现参数整体的拟合效果得到很大提高;对单个效应因子来说,作为固定效应的民族因子、户口因子、受教育程度因子和工作单位因子的参数估计都是比较显著的。特别是受教育程度的参数的显著性有了很大的改善。也说明了GLMM对于满意度评价问题的适用性。3.偏最小二乘回归在现实生产的用的比较广泛,大都用于水质测量、医学、生物、地质等科学领域。PLS-logistic模型是将普通logistic模型、主成分提取方法和典型相关性分析结合起来的一种新的分析模型,巧妙地把偏最小二乘回归和logistic回归的优点结合了起来。PLS-logistic模型能消除观测数据间的多重共线性问题,在提取成分时同时考虑了自变量与因变量的相关性。受前人的启发,本文首次将PLS-logistic模型用于满意度的分析实证中。本文表3.7对变量的选取做了详细的说明,利用统计软件matlab进行模型构建,依次迭代可以发现提取3个偏最小二乘成分时模型最达到优,最后,为了进一步分析自变量对满意度的解释作用,计算了重要性指标VIP来测度,分析并给出了政策建议。