论文部分内容阅读
摘要:近年来,越来越多的学者开始关注人在胎儿和幼儿时期的健康、发育状况对其人力资本积累产生的影响,相关研究结果具有重要的社会意义和经济价值。基于中国教育追踪调查(CEPS)的相关数据,在采用倾向分数匹配方法控制父母、家庭、学校特征以及其他因素导致的异质性问题的前提下,实证分析了出生体重对城镇儿童语文、数学、英语学习成绩的影响。结果表明:出生时低体重对城镇儿童的数学和英语成绩有显著的负向影响,对语文成绩影响不显著。从公共政策角度说明实施诸如营养补助项目、母亲禁烟计划、环境污染治理等干预措施存在必要性。
关键词:出生体重;早期健康;城镇儿童;学习成绩;倾向分数匹配法
中图分类号:C92 文献标识码:A 文章分类号:1674-7089(2019)06-0043-12
作者简介:顾和军,博士,南京信息工程大学商学院、江苏省人才强省研究基地教授、硕士研究生导师;严蔚然,南京信息工程大学商学院硕士研究生。
一、引言
近年来,在流行病学和健康经济学领域,越来越多的学者开始关注人在胎儿和幼儿时期的健康和发育状况对人力资本积累的影响。一般而言,个体早期的健康禀赋具有很强的持续性,不仅影响个体成年后的认知能力,而且会通过人力资本积累间接影响个体成年后的社会经济地位和劳动力市场表现。研究个体早期的健康水平对其后期人力资本积累的影响具有重要意义,原因有兩点:一是个体早期的健康水平可能影响其成年后的健康水平与社会经济地位之间的相关性,二是投资于个体早期健康产生的投资绩效可能高于传统教育投资。因此,用于提高个体早期健康水平的公共政策可能会产生福利的“乘数效应”。
早期健康水平在很大程度上决定了个体未来的发展状况和社会经济地位,因此可以认为早期健康状况对个体未来发展存在长期效应。关于中国儿童早期健康状况的长期效应研究刚刚起步,相关研究在一定程度上证实了早期健康状况不良与人力资本积累、劳动力市场表现之间有一定的负向相关关系,但它们之间是否存在稳定的相关关系.尚需要更多证据。因此,本文以出生体重对城镇儿童学习成绩的影响为切人点,分析了出生体重对学习成绩的影响,证明了实施公共政策干预的必要性,为进一步论证早期健康水平与人力资本积累、劳动力市场表现之间存在一定负向相关关系提供了有益的补充证据。
后文安排如下:首先,梳理与儿童早期健康的长期影响相关的文献;其次,建立计量模型并基于中国教育追踪调查的相关数据进行实证检验;再次,讨论分析实证检验的结果;最后,进行了总结与评述。
二、文献综述
自从巴克于1995年提出“成人疾病的胎儿起源”(Fetal origins of adult disease,FOAD)假说(即著名的“巴克假说”)起,大量文献关注胎儿健康的长期效应。相关研究主要通过考察个体在胎儿时期面临的外生冲击(如战争、饥荒、自然灾害、环境污染等)对其未来人力资本积累的影响来检验“巴克假说”或者研究初始健康禀赋对认知能力的影响,试图证实个体在胎儿时期的发育状况对其成年后的健康、教育、劳动产出具有显著影响。以下从胎儿时期面临的外生冲击对个体人力资本积累的影响,出生体重对学习成绩和认知能力的影响,出生体重对个体的短期和长期影响三个方面对相关文献进行总结。
(一)胎儿时期面临的外生冲击对个体人力资本积累的影响
众多研究表明个体在胎儿期暴露于空气污染或外生冲击之中会影响其人力资本积累。
1.胎儿时期暴露于空气污染中对个体学习成绩的影响
Almond等学者采用瑞典的调查数据,分析了个体在胎儿期暴露于污染中对其人力资本积累产生的作用,结果表明:在胎儿期(第8至25周)高度暴露于污染中,会使个体中学时期的平均成绩、数学成绩相应下降2.5%、6%,对于那些可能面临更高污染暴露水平和低收人家庭的孩子,这种影响更为强烈。Sanders基于美国的调查数据研究发现,出生当年的TSPs(总悬浮颗粒物)浓度每降低1单位会使十年级学生的成绩提高2%一6%,学业通过率提高3%。Bharadwaj等学者利用智利首都圣地亚哥市的数据,分析了个体在胎儿期暴露于污染中与其学习成绩的关系.研究发现:妇女孕期暴露于CO和PM10中会对其子女在四年级时的数学成绩和语言能力有显著的负向影响:妇女怀孕3个月时暴露于含有臭氧的环境中.臭氧浓度每提高1单位会使其子女在四年级时的数学和语文成绩分别降低0.0025和0.0017单位。Molina利用逆温现象测量污染状况,发现怀孕中期暴露于更多逆温现象(意味着更严重的污染)中的个体在青春期和成年期的拉雯(Raven)智力测试得分明显偏低。
2.胎儿时期个体面临的其他外生冲击对其人力资本积累的影响
Persson等学者基于1973-2011年瑞典儿童的数据,分析了在胎儿时期(受孕后40周内)或出生后一年内经历了亲属(不包含母亲)死亡的样本。研究发现:母亲在妊娠期经历亲密家庭成员死亡会对胎儿出生时和出生第一年的身体健康产生显著的负向影响,母亲严重的产前压力(用亲密家庭成员死亡来衡量)与个体心理疾病(包括儿童多动症和成年期的抑郁症)发作之间存在因果关系。
一些学者关注大饥荒对个体未来发展的影响。Chen和Zhou使用中国健康与营养调查数据,采用群体和地区的双重差分法,研究了发生于1959-1961年的大饥荒对个体身高、劳动力供给和收人的影响。结果表明大饥荒对个体的身高、收人、劳动力供给均产生了很大的负向影响。具体而言,若没有饥荒,1959年出生的婴儿平均身高应该增加3.03厘米;出生于大饥荒期间的个体成年后的工作时间更短,收人更低。Almond等学者基于中国2000年的人口普查数据研究发现:在胎儿时期经受严重饥荒的群体其文盲率、失业率更高;胎儿期经历大饥荒的男性个体结婚时间更晚;胎儿期经历大饥荒的女性个体的配偶受教育程度更低。这些均说明饥荒确实会对个体教育、就业、婚姻等产生巨大的影响。马光荣采用中国健康与养老追踪调查数据检验了大饥荒对健康状况的影响。研究表明,在胎儿期经历过大饥荒的个体,其健康状况没有变得更糟糕,但是个体如果在出生后12个月内经历大饥荒,那么他的长期健康状况会变差。 (二)出生体重对学习成绩和认知能力的影响
Hack等学者发现,对于出生体重极低的研究对象而言,其智商和学业成绩较低,留级率较高,在20岁之前高中毕业或获得同等学历的人数较少,接受高等教育的可能性也更低。Goosby和Cheadle基于家庭内部异质性模型得到了出生体重的估计值。结果表明,出生时低体重的个体在5岁时阅读能力较差,在14岁时获得的技能也较少。Bharadwai等学者利用智利的面板数据探讨了出生时的健康状况与学业成果之间的关系,发现个体的出生体重在整个受教育时期都会对学习成绩产生重要影响。具体地,在一年级时,出生体重每增加10%会使数学和语言学习成绩增加0.04至0.06个标准差;出生时低体重(低于2.5千克)或极低出生体重(低于1.5千克)对个体的学习成绩影响更大,相应的数学和语言学习成绩比出生时正常体重的个体大约低0.1至0.2个标准偏差。
(三)出生体重对个体的短期和长期影响
部分文献关注出生体重对个体造成的短期和长期影响,短期影响指一年死亡率等,长期影响包括个体的受教育程度和经济状况等。Miller等学者发现出生体重对个体的收入有积极、直接的影响,但在决定收入水平方面作用很小,出生体重每增加一盎司(相当于28.35克),收人仅增加0.4%。Black等学者基于挪威的人口管理数据,利用固定效应模型考察出生体重对同一群体的短期和长期影响.发现出生体重对个体具有显著的长期影响。出生体重对个体的身高、智商、收入和教育等均有显著影响,且固定效应估计在数值上与横断面估计相近。然而,Nakamuro等基于日本的样本数据发现,出生体重对个体的最高受教育年限和收人没有显著影响。
综上所述,现有研究存在如下三点不足。第一,在研究对象上,文献大多基于国外数据分析早期健康水平及相关因素对个体学习成绩和人力资本积累的影响.极少涉及专门针对中国数据的相关分析。第二,在研究内容上,尽管关于出生体重与学习成绩之间关系的研究较多,但是分析中国胎儿出生体重对学习成绩的影响,仍然可以为“早期健康状况不良与人力资本积累及劳动力市场表现之间存在一定反向关系”提供有益的补充论证。第三,在研究方法上,以OLS(普通最小二乘法)作为主要研究方法的文献无法消除样本异质性导致的估计偏误,进而可能影响结论的可靠性。
有鉴于此,本文基于中国教育追踪调查(CEPS)数据,在采用倾向得分匹配(PSM)方法处理样本异质性问题的前提下,分析了出生时低体重对中国城镇儿童的语文、数学、英语三门课程学习成绩的影响,证明实施提高儿童早期健康水平和缩小人力资本差距等方面的公共政策存在必要性。
三、模型方法与数据说明
(一)估计方法
1.OIS估计方法
出生体重作为反映新生儿健康水平的重要指标之一,在研究中被广泛使用。利用OLS方法估计出生时低体重对个体学习成绩影响的基本计量模型为:其中,a、β、y为模型参数,u为扰动项,x为个体、父母、所在学校的特征变量,Score表示个体的课程(语文、数学、英语)学习成绩,Weight表示个体的出生体重。由学校提供被调查个体的考试成绩,并按照满分为100分对考试成绩进行换算.换算结果作为Score变量的取值。根据研究需要将Weight处理为虚拟变量。如果出生体重低于2.5千克(低体重),Weight=1;否则(正常体重),Weight=0。
一般来说,个体出生时低体重可能与父母的健康状况欠佳、母亲孕期营养摄人不足等诸多因素有关,这些影响因素导致个体异质性。如果忽略个体异质性,直接利用方程(1)进行估计将可能导致估计偏误问题。
2.倾向得分匹配方法
选择倾向得分匹配方法处理样本异质性问题时,需要为处理组寻找一个合适的反事实对照组,這里将处理组设定为出生时低体重的儿童,反事实对照组设定为出生时正常体重的儿童。具体步骤如下:首先,利用可观测的相关特征数据,估计个体出生时为低体重的概率Pr(x),得到其倾向得分;其次,将与出生时低体重个体的倾向得分最接近的正常体重个体选人反事实对照组;最后,计算处理组与对照组之间学习成绩的期望差值,即可得到出生时低体重对城镇儿童学习成绩的平均影响效应(记为TATT)。计算公式为:
为满足条件独立假设,要在估计时尽可能控制影响个体学习成绩的因素。选取的控制变量包括儿童的个体特征、家庭特征、学校特征。其中,儿童的个体特征包括性别、民族、兄弟姐妹的数量、上辅导班的投入,家庭特征包括父母的受教育水平、生育孩子时的年龄、婚姻状况、经济状况,学校特征仅指学校排名。此外,考虑到地区差异性可能导致的难以度量或不可观测因素,文中还对地区固定效应进行了控制。
(二)数据说明
所用原始数据均来源于中国教育追踪调查(CEPS)。该调查是全国性的大型追踪调查项目,由中国人民大学中国调查与数据中心设计与实施。中国教育追踪调查将2013-2014学年作为基线,以初中一年级(七年级)和初中三年级(九年级)两个同期群为调查起点,将人口平均受教育水平和流动人口比例作为分层变量从全国随机抽取调查点,最终抽取的调查点包括28个县级单位(县、区、市)。调查的执行以学校为基础,在入选的县级单位中随机抽取并调查了112所学校的438个班级,被抽中班级的学生全体入样,基线调查涉及约2万名学生。根据截面分析对数据的要求,选用2014-2015学年的调查数据。研究对象为中国城镇初中二年级(八年级)学生,样本数量为3607。其中,出生时低体重样本量为511,正常体重样本量为3096。
(三)数据的描述性统计
表1给出了样本数据的描述性统计。出生时低体重个体和正常体重个体的平均语文成绩分别为67.52和71.52,平均数学成绩分别为60.85和69.73,平均英语成绩分别为61.54和70.38。出生时低体重个体的平均语文成绩、平均数学成绩、平均英语成绩均低于出生时正常体重个体的对应科目平均成绩。同时,不难看出,出生时低体重个体的语文成绩、数学成绩、英语成绩的方差(依次为14.19、26.67、24.29)均高于出生时正常体重个体对应科目成绩的方差(依次为12.61、23.28、21.95)。结合平均成绩的比较结果,可以发现出生时低体重个体学习成绩的变异系数更高,从而说明其学习成绩的分布更加离散,波动程度更大。学习成绩的差异为识别儿童早期健康状况的长期影响创造了条件。 从表1中还可以发现,出生时低体重个体与出生时正常体重个体所在家庭的特征也存在一定差异。比如,与出生时正常体重儿童相比,出生时低体重儿童的家庭经济状况较差,父母的受教育水平较低,兄弟姐妹的数量更多,上辅导班的支出更少,所在学校排名更低,所在社区环境污染程度更严重。可以初步判断,出生时低体重个体与出生时正常体重个体所在的群组存在明显差异。
四、实证估计结果
(一)OLS估计结果
表2为出生体重与学习成绩的015回归结果。可以看到,在控制其他因素的情况下,出生时低体重儿童的语文成绩、数学成绩、英语成绩均显著低于出生时正常体重儿童的相应科目学习成绩。出生时低体重对学习成绩有负向影响,但是对于不同课程的影响程度及相应的统计显著程度存在差异。出生时低体重对城镇儿童语文成绩、数学成绩、英语成绩的影响系数分别为-1.192、-2,895、-2.322,并且至少在5%的显著水平上显著。从儿童的性别和民族特征看,性别对学习成绩有显著的负向影响,但是民族对儿童学习成绩的影响不一致,仅对语文学习成绩有显著影响。
父母的特征变量对儿童学习成绩有重要影响。父亲和母亲的受教育水平对儿童学习成绩均有显著正向影响,并且从影响系数大小来看,父亲的受教育水平对儿童学习成绩的影响更高。家庭人力资本是影响子女教育成果的重要因素,大量研究将父母受教育水平作为测量指标来探讨家庭人力资本对子女学业成绩的影响,一般认为父母受教育水平对子女学业成绩有显著影响.父母受教育水平较高的学生其学业成绩显著高于平均成绩。父母是否处于在婚(在婚是指婚姻处于延续、未离异状态)也对儿童的学习成绩有显著影响,且对语文成绩的影响尤其显著。但是,父亲和母亲生育该孩子的年龄对儿童学习成绩的影响均不显著。
表2还表明,家庭中兄弟姐妹的数量对儿童和学习成绩均有显著的负向影响,这一结果意味着孩子的数量与培养质量之间很难被兼顾。因为孩子数量增加,而家庭(主要是父母)的精力和资源投入存在上限,所以家庭在每个孩子身上的平均投入减少。家庭经济状况对儿童的学习成绩有负向影响,但是对于英语成绩的影响并不显著。上辅导班的支出对儿童学习成绩有显著正向影响。
此外,所在学校的排名对儿童学习成绩有显著正向影响,所在社区的环境污染状况对于儿童学习成绩没有显著影响。
(二)PSM估计结果
1.估计结果
为了避免前述OLS方法可能导致的估计偏误问题.接下来将采用倾向得分匹配方法估计出生时低体重对语文、数学、英语三科学习成绩的影响。仍然使用上述OLS模型中用于估计出生时低体重的影响因素,并将相应的预测值作为倾向得分,然后分别使用不同的方法进行匹配,包括核匹配(Kernel matching)和最近相邻匹配(Nearest neighbormatching)。理论上,使用不同匹配方法得到的估计结果应该基本一致,主要差異在于估计值的大小方面。
表3为通过PSM方法控制内生性之后的估计结果,其中,PSM-Kernel和PSM-NN分别表示采用核匹配和最近相邻匹配的PSM方法。可以看到,出生时低体重对儿童的数学和英语成绩均有显著负向影响,虽然对语文成绩的影响也为负,但是在统计上并不显著。此外,PSM-Kernel方法对对照组信息的利用比PSM-NN方法更充分。在大样本情况下,两者的估计值虽然有一定差异,但方向和显著性类似,这也在一定程度上说明分析结果比较稳健。
2.处理组和对照组的平衡性检验
使用PSM方法需要特别关注处理组与对照组之间的平衡性问题,即经过匹配后.除了儿童学习成绩有差异之外,处理组与对照组之间在父母、家庭、学校、社区特征等方面不应该存在显著差异。表4为根据倾向得分法进行匹配后处理组和对照组的平衡性检验结果。可以看到,在匹配之前,处理组和对照组之间存在较大的偏误,两组之间在民族、父亲受教育水平、母亲受教育水平、兄弟姐妹数量、上辅导班的支出、所在学校排名等变量上的差异t检验统计量取值明显大于或小于0,匹配前这些基本特征变量在处理组和对照组之间确实存在显著差异。但是,匹配后这些特征变量的偏误比例降至10%以内,处理组和对照组之间已不存在显著差异。可见,采用PSM匹配方法能够有效解决处理组与对照组之间因异质性而导致的偏误问题。值得注意的是,匹配前父亲、母亲受教育水平在处理组和对照组之间均存在显著差异,但是匹配后已经没有显著差异。这意味着经过匹配后,处理组和对照组不存在由于遗传原因导致的差异,因而可以认为不存在学习能力差异。
(三)稳健性检验
1.标准化学习成绩的估计结果
因为不同学校考试试卷、评分标准不同,所以不同学校和年级之间学生的成绩需要经过处理之后,才具有可比性。处理方法是根据年级平均成绩和标准差对学生成绩进行数据标准化,由于标准化之后的成绩是一个相对成绩,因而可以解决可比性问题。表5给出了OLS和PSM方法的估计结果。可以看到,经过标准化处理之后,出生时低体重对城镇儿童的数学和英语成绩仍然有显著的负向影响,尽管对语文成绩也具有负向影响,但统计上不显著。
2.控制学校特征的固定效应
上述回归方程只考虑了学校在当地的排名,事实上.学校特征层面还有一些影响儿童学习成绩但难以度量或不可观测的因素。为了消除这些因素对估计结果的潜在影响,确保检验结果的稳健性,这里对学校特征的固定效应进行了控制。表6给出了对学校特征的固定效应进行控制之后出生体重与学习成绩的回归结果。可以看到,对学校特征的固定效应进行控制之后,出生时低体重对儿童的数学和英语成绩仍然有显著的负向影响.尽管对语文成绩也有负向影响,但统计上不显著。与未对学校特征的固定效应进行控制相比较,除了估计值有差异之外.出生时低体重对各科学习成绩的作用方向及相应显著性均非常接近,这表明前述检验结果具有稳健性。
五、总结和评述
采用中国教育追踪调查数据,探讨了出生时低体重对城镇儿童语文、数学、英语三科学习成绩的影响.发现出生时低体重对城镇儿童的数学成绩和英语成绩具有显著的负向影响,但对语文成绩的影响不显著。
由于我国实行中考制度,学生的中考成绩直接决定其能否顺利升人高中,因此个体出生时不良的健康状况将对其产生长期和持续的影响,最终可能影响个体未来的教育水平和人力资本积累。本文的实证结果对于制定用于提高儿童早期健康水平,缩小人力资本差距,减少贫困的公共政策具有一定启示,验证了儿童早期健康的重要性,为实施孕期干预措施(比如营养补助项目、母亲禁烟计划、环境污染治理)等公共政策的必要性提供了证据。
本文仅探讨了早期健康状况对学习成绩是否存在显著影响,而关于相关的作用机制以及是否存在长期效应和因果关系等问题还有待进一步考证。
(责任编辑:来向红)
关键词:出生体重;早期健康;城镇儿童;学习成绩;倾向分数匹配法
中图分类号:C92 文献标识码:A 文章分类号:1674-7089(2019)06-0043-12
作者简介:顾和军,博士,南京信息工程大学商学院、江苏省人才强省研究基地教授、硕士研究生导师;严蔚然,南京信息工程大学商学院硕士研究生。
一、引言
近年来,在流行病学和健康经济学领域,越来越多的学者开始关注人在胎儿和幼儿时期的健康和发育状况对人力资本积累的影响。一般而言,个体早期的健康禀赋具有很强的持续性,不仅影响个体成年后的认知能力,而且会通过人力资本积累间接影响个体成年后的社会经济地位和劳动力市场表现。研究个体早期的健康水平对其后期人力资本积累的影响具有重要意义,原因有兩点:一是个体早期的健康水平可能影响其成年后的健康水平与社会经济地位之间的相关性,二是投资于个体早期健康产生的投资绩效可能高于传统教育投资。因此,用于提高个体早期健康水平的公共政策可能会产生福利的“乘数效应”。
早期健康水平在很大程度上决定了个体未来的发展状况和社会经济地位,因此可以认为早期健康状况对个体未来发展存在长期效应。关于中国儿童早期健康状况的长期效应研究刚刚起步,相关研究在一定程度上证实了早期健康状况不良与人力资本积累、劳动力市场表现之间有一定的负向相关关系,但它们之间是否存在稳定的相关关系.尚需要更多证据。因此,本文以出生体重对城镇儿童学习成绩的影响为切人点,分析了出生体重对学习成绩的影响,证明了实施公共政策干预的必要性,为进一步论证早期健康水平与人力资本积累、劳动力市场表现之间存在一定负向相关关系提供了有益的补充证据。
后文安排如下:首先,梳理与儿童早期健康的长期影响相关的文献;其次,建立计量模型并基于中国教育追踪调查的相关数据进行实证检验;再次,讨论分析实证检验的结果;最后,进行了总结与评述。
二、文献综述
自从巴克于1995年提出“成人疾病的胎儿起源”(Fetal origins of adult disease,FOAD)假说(即著名的“巴克假说”)起,大量文献关注胎儿健康的长期效应。相关研究主要通过考察个体在胎儿时期面临的外生冲击(如战争、饥荒、自然灾害、环境污染等)对其未来人力资本积累的影响来检验“巴克假说”或者研究初始健康禀赋对认知能力的影响,试图证实个体在胎儿时期的发育状况对其成年后的健康、教育、劳动产出具有显著影响。以下从胎儿时期面临的外生冲击对个体人力资本积累的影响,出生体重对学习成绩和认知能力的影响,出生体重对个体的短期和长期影响三个方面对相关文献进行总结。
(一)胎儿时期面临的外生冲击对个体人力资本积累的影响
众多研究表明个体在胎儿期暴露于空气污染或外生冲击之中会影响其人力资本积累。
1.胎儿时期暴露于空气污染中对个体学习成绩的影响
Almond等学者采用瑞典的调查数据,分析了个体在胎儿期暴露于污染中对其人力资本积累产生的作用,结果表明:在胎儿期(第8至25周)高度暴露于污染中,会使个体中学时期的平均成绩、数学成绩相应下降2.5%、6%,对于那些可能面临更高污染暴露水平和低收人家庭的孩子,这种影响更为强烈。Sanders基于美国的调查数据研究发现,出生当年的TSPs(总悬浮颗粒物)浓度每降低1单位会使十年级学生的成绩提高2%一6%,学业通过率提高3%。Bharadwaj等学者利用智利首都圣地亚哥市的数据,分析了个体在胎儿期暴露于污染中与其学习成绩的关系.研究发现:妇女孕期暴露于CO和PM10中会对其子女在四年级时的数学成绩和语言能力有显著的负向影响:妇女怀孕3个月时暴露于含有臭氧的环境中.臭氧浓度每提高1单位会使其子女在四年级时的数学和语文成绩分别降低0.0025和0.0017单位。Molina利用逆温现象测量污染状况,发现怀孕中期暴露于更多逆温现象(意味着更严重的污染)中的个体在青春期和成年期的拉雯(Raven)智力测试得分明显偏低。
2.胎儿时期个体面临的其他外生冲击对其人力资本积累的影响
Persson等学者基于1973-2011年瑞典儿童的数据,分析了在胎儿时期(受孕后40周内)或出生后一年内经历了亲属(不包含母亲)死亡的样本。研究发现:母亲在妊娠期经历亲密家庭成员死亡会对胎儿出生时和出生第一年的身体健康产生显著的负向影响,母亲严重的产前压力(用亲密家庭成员死亡来衡量)与个体心理疾病(包括儿童多动症和成年期的抑郁症)发作之间存在因果关系。
一些学者关注大饥荒对个体未来发展的影响。Chen和Zhou使用中国健康与营养调查数据,采用群体和地区的双重差分法,研究了发生于1959-1961年的大饥荒对个体身高、劳动力供给和收人的影响。结果表明大饥荒对个体的身高、收人、劳动力供给均产生了很大的负向影响。具体而言,若没有饥荒,1959年出生的婴儿平均身高应该增加3.03厘米;出生于大饥荒期间的个体成年后的工作时间更短,收人更低。Almond等学者基于中国2000年的人口普查数据研究发现:在胎儿时期经受严重饥荒的群体其文盲率、失业率更高;胎儿期经历大饥荒的男性个体结婚时间更晚;胎儿期经历大饥荒的女性个体的配偶受教育程度更低。这些均说明饥荒确实会对个体教育、就业、婚姻等产生巨大的影响。马光荣采用中国健康与养老追踪调查数据检验了大饥荒对健康状况的影响。研究表明,在胎儿期经历过大饥荒的个体,其健康状况没有变得更糟糕,但是个体如果在出生后12个月内经历大饥荒,那么他的长期健康状况会变差。 (二)出生体重对学习成绩和认知能力的影响
Hack等学者发现,对于出生体重极低的研究对象而言,其智商和学业成绩较低,留级率较高,在20岁之前高中毕业或获得同等学历的人数较少,接受高等教育的可能性也更低。Goosby和Cheadle基于家庭内部异质性模型得到了出生体重的估计值。结果表明,出生时低体重的个体在5岁时阅读能力较差,在14岁时获得的技能也较少。Bharadwai等学者利用智利的面板数据探讨了出生时的健康状况与学业成果之间的关系,发现个体的出生体重在整个受教育时期都会对学习成绩产生重要影响。具体地,在一年级时,出生体重每增加10%会使数学和语言学习成绩增加0.04至0.06个标准差;出生时低体重(低于2.5千克)或极低出生体重(低于1.5千克)对个体的学习成绩影响更大,相应的数学和语言学习成绩比出生时正常体重的个体大约低0.1至0.2个标准偏差。
(三)出生体重对个体的短期和长期影响
部分文献关注出生体重对个体造成的短期和长期影响,短期影响指一年死亡率等,长期影响包括个体的受教育程度和经济状况等。Miller等学者发现出生体重对个体的收入有积极、直接的影响,但在决定收入水平方面作用很小,出生体重每增加一盎司(相当于28.35克),收人仅增加0.4%。Black等学者基于挪威的人口管理数据,利用固定效应模型考察出生体重对同一群体的短期和长期影响.发现出生体重对个体具有显著的长期影响。出生体重对个体的身高、智商、收入和教育等均有显著影响,且固定效应估计在数值上与横断面估计相近。然而,Nakamuro等基于日本的样本数据发现,出生体重对个体的最高受教育年限和收人没有显著影响。
综上所述,现有研究存在如下三点不足。第一,在研究对象上,文献大多基于国外数据分析早期健康水平及相关因素对个体学习成绩和人力资本积累的影响.极少涉及专门针对中国数据的相关分析。第二,在研究内容上,尽管关于出生体重与学习成绩之间关系的研究较多,但是分析中国胎儿出生体重对学习成绩的影响,仍然可以为“早期健康状况不良与人力资本积累及劳动力市场表现之间存在一定反向关系”提供有益的补充论证。第三,在研究方法上,以OLS(普通最小二乘法)作为主要研究方法的文献无法消除样本异质性导致的估计偏误,进而可能影响结论的可靠性。
有鉴于此,本文基于中国教育追踪调查(CEPS)数据,在采用倾向得分匹配(PSM)方法处理样本异质性问题的前提下,分析了出生时低体重对中国城镇儿童的语文、数学、英语三门课程学习成绩的影响,证明实施提高儿童早期健康水平和缩小人力资本差距等方面的公共政策存在必要性。
三、模型方法与数据说明
(一)估计方法
1.OIS估计方法
出生体重作为反映新生儿健康水平的重要指标之一,在研究中被广泛使用。利用OLS方法估计出生时低体重对个体学习成绩影响的基本计量模型为:其中,a、β、y为模型参数,u为扰动项,x为个体、父母、所在学校的特征变量,Score表示个体的课程(语文、数学、英语)学习成绩,Weight表示个体的出生体重。由学校提供被调查个体的考试成绩,并按照满分为100分对考试成绩进行换算.换算结果作为Score变量的取值。根据研究需要将Weight处理为虚拟变量。如果出生体重低于2.5千克(低体重),Weight=1;否则(正常体重),Weight=0。
一般来说,个体出生时低体重可能与父母的健康状况欠佳、母亲孕期营养摄人不足等诸多因素有关,这些影响因素导致个体异质性。如果忽略个体异质性,直接利用方程(1)进行估计将可能导致估计偏误问题。
2.倾向得分匹配方法
选择倾向得分匹配方法处理样本异质性问题时,需要为处理组寻找一个合适的反事实对照组,這里将处理组设定为出生时低体重的儿童,反事实对照组设定为出生时正常体重的儿童。具体步骤如下:首先,利用可观测的相关特征数据,估计个体出生时为低体重的概率Pr(x),得到其倾向得分;其次,将与出生时低体重个体的倾向得分最接近的正常体重个体选人反事实对照组;最后,计算处理组与对照组之间学习成绩的期望差值,即可得到出生时低体重对城镇儿童学习成绩的平均影响效应(记为TATT)。计算公式为:
为满足条件独立假设,要在估计时尽可能控制影响个体学习成绩的因素。选取的控制变量包括儿童的个体特征、家庭特征、学校特征。其中,儿童的个体特征包括性别、民族、兄弟姐妹的数量、上辅导班的投入,家庭特征包括父母的受教育水平、生育孩子时的年龄、婚姻状况、经济状况,学校特征仅指学校排名。此外,考虑到地区差异性可能导致的难以度量或不可观测因素,文中还对地区固定效应进行了控制。
(二)数据说明
所用原始数据均来源于中国教育追踪调查(CEPS)。该调查是全国性的大型追踪调查项目,由中国人民大学中国调查与数据中心设计与实施。中国教育追踪调查将2013-2014学年作为基线,以初中一年级(七年级)和初中三年级(九年级)两个同期群为调查起点,将人口平均受教育水平和流动人口比例作为分层变量从全国随机抽取调查点,最终抽取的调查点包括28个县级单位(县、区、市)。调查的执行以学校为基础,在入选的县级单位中随机抽取并调查了112所学校的438个班级,被抽中班级的学生全体入样,基线调查涉及约2万名学生。根据截面分析对数据的要求,选用2014-2015学年的调查数据。研究对象为中国城镇初中二年级(八年级)学生,样本数量为3607。其中,出生时低体重样本量为511,正常体重样本量为3096。
(三)数据的描述性统计
表1给出了样本数据的描述性统计。出生时低体重个体和正常体重个体的平均语文成绩分别为67.52和71.52,平均数学成绩分别为60.85和69.73,平均英语成绩分别为61.54和70.38。出生时低体重个体的平均语文成绩、平均数学成绩、平均英语成绩均低于出生时正常体重个体的对应科目平均成绩。同时,不难看出,出生时低体重个体的语文成绩、数学成绩、英语成绩的方差(依次为14.19、26.67、24.29)均高于出生时正常体重个体对应科目成绩的方差(依次为12.61、23.28、21.95)。结合平均成绩的比较结果,可以发现出生时低体重个体学习成绩的变异系数更高,从而说明其学习成绩的分布更加离散,波动程度更大。学习成绩的差异为识别儿童早期健康状况的长期影响创造了条件。 从表1中还可以发现,出生时低体重个体与出生时正常体重个体所在家庭的特征也存在一定差异。比如,与出生时正常体重儿童相比,出生时低体重儿童的家庭经济状况较差,父母的受教育水平较低,兄弟姐妹的数量更多,上辅导班的支出更少,所在学校排名更低,所在社区环境污染程度更严重。可以初步判断,出生时低体重个体与出生时正常体重个体所在的群组存在明显差异。
四、实证估计结果
(一)OLS估计结果
表2为出生体重与学习成绩的015回归结果。可以看到,在控制其他因素的情况下,出生时低体重儿童的语文成绩、数学成绩、英语成绩均显著低于出生时正常体重儿童的相应科目学习成绩。出生时低体重对学习成绩有负向影响,但是对于不同课程的影响程度及相应的统计显著程度存在差异。出生时低体重对城镇儿童语文成绩、数学成绩、英语成绩的影响系数分别为-1.192、-2,895、-2.322,并且至少在5%的显著水平上显著。从儿童的性别和民族特征看,性别对学习成绩有显著的负向影响,但是民族对儿童学习成绩的影响不一致,仅对语文学习成绩有显著影响。
父母的特征变量对儿童学习成绩有重要影响。父亲和母亲的受教育水平对儿童学习成绩均有显著正向影响,并且从影响系数大小来看,父亲的受教育水平对儿童学习成绩的影响更高。家庭人力资本是影响子女教育成果的重要因素,大量研究将父母受教育水平作为测量指标来探讨家庭人力资本对子女学业成绩的影响,一般认为父母受教育水平对子女学业成绩有显著影响.父母受教育水平较高的学生其学业成绩显著高于平均成绩。父母是否处于在婚(在婚是指婚姻处于延续、未离异状态)也对儿童的学习成绩有显著影响,且对语文成绩的影响尤其显著。但是,父亲和母亲生育该孩子的年龄对儿童学习成绩的影响均不显著。
表2还表明,家庭中兄弟姐妹的数量对儿童和学习成绩均有显著的负向影响,这一结果意味着孩子的数量与培养质量之间很难被兼顾。因为孩子数量增加,而家庭(主要是父母)的精力和资源投入存在上限,所以家庭在每个孩子身上的平均投入减少。家庭经济状况对儿童的学习成绩有负向影响,但是对于英语成绩的影响并不显著。上辅导班的支出对儿童学习成绩有显著正向影响。
此外,所在学校的排名对儿童学习成绩有显著正向影响,所在社区的环境污染状况对于儿童学习成绩没有显著影响。
(二)PSM估计结果
1.估计结果
为了避免前述OLS方法可能导致的估计偏误问题.接下来将采用倾向得分匹配方法估计出生时低体重对语文、数学、英语三科学习成绩的影响。仍然使用上述OLS模型中用于估计出生时低体重的影响因素,并将相应的预测值作为倾向得分,然后分别使用不同的方法进行匹配,包括核匹配(Kernel matching)和最近相邻匹配(Nearest neighbormatching)。理论上,使用不同匹配方法得到的估计结果应该基本一致,主要差異在于估计值的大小方面。
表3为通过PSM方法控制内生性之后的估计结果,其中,PSM-Kernel和PSM-NN分别表示采用核匹配和最近相邻匹配的PSM方法。可以看到,出生时低体重对儿童的数学和英语成绩均有显著负向影响,虽然对语文成绩的影响也为负,但是在统计上并不显著。此外,PSM-Kernel方法对对照组信息的利用比PSM-NN方法更充分。在大样本情况下,两者的估计值虽然有一定差异,但方向和显著性类似,这也在一定程度上说明分析结果比较稳健。
2.处理组和对照组的平衡性检验
使用PSM方法需要特别关注处理组与对照组之间的平衡性问题,即经过匹配后.除了儿童学习成绩有差异之外,处理组与对照组之间在父母、家庭、学校、社区特征等方面不应该存在显著差异。表4为根据倾向得分法进行匹配后处理组和对照组的平衡性检验结果。可以看到,在匹配之前,处理组和对照组之间存在较大的偏误,两组之间在民族、父亲受教育水平、母亲受教育水平、兄弟姐妹数量、上辅导班的支出、所在学校排名等变量上的差异t检验统计量取值明显大于或小于0,匹配前这些基本特征变量在处理组和对照组之间确实存在显著差异。但是,匹配后这些特征变量的偏误比例降至10%以内,处理组和对照组之间已不存在显著差异。可见,采用PSM匹配方法能够有效解决处理组与对照组之间因异质性而导致的偏误问题。值得注意的是,匹配前父亲、母亲受教育水平在处理组和对照组之间均存在显著差异,但是匹配后已经没有显著差异。这意味着经过匹配后,处理组和对照组不存在由于遗传原因导致的差异,因而可以认为不存在学习能力差异。
(三)稳健性检验
1.标准化学习成绩的估计结果
因为不同学校考试试卷、评分标准不同,所以不同学校和年级之间学生的成绩需要经过处理之后,才具有可比性。处理方法是根据年级平均成绩和标准差对学生成绩进行数据标准化,由于标准化之后的成绩是一个相对成绩,因而可以解决可比性问题。表5给出了OLS和PSM方法的估计结果。可以看到,经过标准化处理之后,出生时低体重对城镇儿童的数学和英语成绩仍然有显著的负向影响,尽管对语文成绩也具有负向影响,但统计上不显著。
2.控制学校特征的固定效应
上述回归方程只考虑了学校在当地的排名,事实上.学校特征层面还有一些影响儿童学习成绩但难以度量或不可观测的因素。为了消除这些因素对估计结果的潜在影响,确保检验结果的稳健性,这里对学校特征的固定效应进行了控制。表6给出了对学校特征的固定效应进行控制之后出生体重与学习成绩的回归结果。可以看到,对学校特征的固定效应进行控制之后,出生时低体重对儿童的数学和英语成绩仍然有显著的负向影响.尽管对语文成绩也有负向影响,但统计上不显著。与未对学校特征的固定效应进行控制相比较,除了估计值有差异之外.出生时低体重对各科学习成绩的作用方向及相应显著性均非常接近,这表明前述检验结果具有稳健性。
五、总结和评述
采用中国教育追踪调查数据,探讨了出生时低体重对城镇儿童语文、数学、英语三科学习成绩的影响.发现出生时低体重对城镇儿童的数学成绩和英语成绩具有显著的负向影响,但对语文成绩的影响不显著。
由于我国实行中考制度,学生的中考成绩直接决定其能否顺利升人高中,因此个体出生时不良的健康状况将对其产生长期和持续的影响,最终可能影响个体未来的教育水平和人力资本积累。本文的实证结果对于制定用于提高儿童早期健康水平,缩小人力资本差距,减少贫困的公共政策具有一定启示,验证了儿童早期健康的重要性,为实施孕期干预措施(比如营养补助项目、母亲禁烟计划、环境污染治理)等公共政策的必要性提供了证据。
本文仅探讨了早期健康状况对学习成绩是否存在显著影响,而关于相关的作用机制以及是否存在长期效应和因果关系等问题还有待进一步考证。
(责任编辑:来向红)