论文部分内容阅读
在有关工资问题的实证研究中,样本选择性偏差是一个不容忽视的问题,处理不当会导致最终的估计结果产生严重偏差,继而得出误导性的研究结论。一般而言,处理样本选择眭问题的计量方法都侧重于条件均值模型的估计,然而,随着分位数回归模型的不断发展和完善,研究者们越来越多的关注于随机变量整体分布的变化,通过分位点的变动来获取更加全面的信息。
Arellano和Bonhome(2017)提出了一个在分位数回归模型中存在样本选择性偏差的估计量。他们通过选择方程和结果方程中误差项的联合分布函数或称Copula函数来刻画样本选择性偏差,用二者的相关系数来表示样本选择的程度,并通过矩条件来估计这?。相关系数也即Copula参数,从而校正分位数回归中的选择性问题,并最终通过“旋转的”检查函数估计出分位数回归的系数。
本文的理论部分以上述模型为基础,将Box-Cox变换应用到Arellano和Bonhome(2017)的模型中,提出了一个新的估计量,使其更加符合线性设定。我们详尽讨论了该估计量的识别条件和估计问题。蒙特卡罗模拟的结果表明,该估计量在有限样本下表现良好。另外,我们还在实证分析中发现,Box-Cox变换系数随着分位点的增加而不断减小。理论部分的最后一节内容是我们将上述改进模型直接扩展到分位数处理效应模型的框架下,并讨论了该分位数处理效应的识别和估计。
有了上述理论基础,我们将基于中国家庭收入调查项目(CHIPS)2013年的数据探究农民工内部的收入差距问题。首先,我们研究了影响农民工工资的不同因素。在研究这一问题时,如果直接进行oLS回归可能会出现样本自选择偏差,导致估计值有偏。这是因为我们只能观察到仍在城镇中务工的农民工的收入,而那些曾经进城务工但又由于种种原因如个人能力等返乡的农民工,他们在城镇的收入我们观测不到,因此获得的样本是自选择的结果。针对这一问题,我们从农村居民样本中挑选出那些曾经进城务工但又返乡的农民工个体,将他们合并到农民工样本中去,对照Heckman两阶段的方法以及本文改进的样本选择分位数模型进行估计。选择方程的估计结果表明,农民工仍留在城镇务工是负向决策,能力更强的农民工会在城镇积累了一定财富之后回到农村。通过对工资方程的回归,我们发现性别仍是影响农民工工资的重要因素,女性的平均工资要比男性低34.2%,但农民工的能力越强,性别对其工资的影响在不断减弱。另外,大学学历(包括大学专科)对农民工工资有着非常显著的正向促进作用,由此可见,提高农民工的受教育程度尤其是大学教育仍是提高其收入的重要方式。然而,工作经验对农民工工资的影响却并不显著。
另一方面,在我们研究农民工内部的收入差距时,着重考察了仍留在城镇中的农民工与返乡农民工之间的收入差距。由于农民工的返乡决策并不是随机产生的,因此会面临内生性的选择偏差。当我们用平均处理效应修正了内生性选择偏差之后,发现农民工与返乡农民工之间的收入差距并不显著。然而,分位数回归的结果表明,在其他因素不变的情况下,中低分位点上农民工与返乡农民工之间的收入差距并不明显,但随着分位点的提高,农民工与返乡农民工的收入差距呈现不断增大的趋势,在能力最高的农民工群体中,返乡农民工的收入甚至高于留在城镇中务工的农民工47.5%。这可能是由城乡收入差距的缩小、农村产业结构的调整等一系列因素造成。
Arellano和Bonhome(2017)提出了一个在分位数回归模型中存在样本选择性偏差的估计量。他们通过选择方程和结果方程中误差项的联合分布函数或称Copula函数来刻画样本选择性偏差,用二者的相关系数来表示样本选择的程度,并通过矩条件来估计这?。相关系数也即Copula参数,从而校正分位数回归中的选择性问题,并最终通过“旋转的”检查函数估计出分位数回归的系数。
本文的理论部分以上述模型为基础,将Box-Cox变换应用到Arellano和Bonhome(2017)的模型中,提出了一个新的估计量,使其更加符合线性设定。我们详尽讨论了该估计量的识别条件和估计问题。蒙特卡罗模拟的结果表明,该估计量在有限样本下表现良好。另外,我们还在实证分析中发现,Box-Cox变换系数随着分位点的增加而不断减小。理论部分的最后一节内容是我们将上述改进模型直接扩展到分位数处理效应模型的框架下,并讨论了该分位数处理效应的识别和估计。
有了上述理论基础,我们将基于中国家庭收入调查项目(CHIPS)2013年的数据探究农民工内部的收入差距问题。首先,我们研究了影响农民工工资的不同因素。在研究这一问题时,如果直接进行oLS回归可能会出现样本自选择偏差,导致估计值有偏。这是因为我们只能观察到仍在城镇中务工的农民工的收入,而那些曾经进城务工但又由于种种原因如个人能力等返乡的农民工,他们在城镇的收入我们观测不到,因此获得的样本是自选择的结果。针对这一问题,我们从农村居民样本中挑选出那些曾经进城务工但又返乡的农民工个体,将他们合并到农民工样本中去,对照Heckman两阶段的方法以及本文改进的样本选择分位数模型进行估计。选择方程的估计结果表明,农民工仍留在城镇务工是负向决策,能力更强的农民工会在城镇积累了一定财富之后回到农村。通过对工资方程的回归,我们发现性别仍是影响农民工工资的重要因素,女性的平均工资要比男性低34.2%,但农民工的能力越强,性别对其工资的影响在不断减弱。另外,大学学历(包括大学专科)对农民工工资有着非常显著的正向促进作用,由此可见,提高农民工的受教育程度尤其是大学教育仍是提高其收入的重要方式。然而,工作经验对农民工工资的影响却并不显著。
另一方面,在我们研究农民工内部的收入差距时,着重考察了仍留在城镇中的农民工与返乡农民工之间的收入差距。由于农民工的返乡决策并不是随机产生的,因此会面临内生性的选择偏差。当我们用平均处理效应修正了内生性选择偏差之后,发现农民工与返乡农民工之间的收入差距并不显著。然而,分位数回归的结果表明,在其他因素不变的情况下,中低分位点上农民工与返乡农民工之间的收入差距并不明显,但随着分位点的提高,农民工与返乡农民工的收入差距呈现不断增大的趋势,在能力最高的农民工群体中,返乡农民工的收入甚至高于留在城镇中务工的农民工47.5%。这可能是由城乡收入差距的缩小、农村产业结构的调整等一系列因素造成。