缺失数据对微观计量影响研究——以农民收入与消费为例

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:abcprint
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微观计量经济学是介于经济学和统计学之间的边缘科学,它是研究微观数据——即大量个人、家庭或企业的经济信息的经济理论和统计方法。近些年内,国内微观经济学的研究集中在模型、估计和检验理论与相关应用上,而对这些模型的基础——数据重视不够。经济理论、数学方法和数据是计量经济学模型成功的三大要素,样本信息的质量直接关系到计量模型经济模型成功与否。其中,缺失数据是影响样本质量的一个关键因素,在个人、团体或政府的社会调查中,常常面临着缺失数据的问题,然而,虽然微观计量经济学已出现了大量的相关理论与方法,但对于缺失数据对模型估计带来的问题,还没有引起研究者的足够重视。   基于上述原因,本论文从缺失数据(无回答)的入手,探讨了缺失数据产生的原因与机制,论述了缺失数据给微观计量带来的影响。就调查项目而言,回答层与无回答层是否在数量特征上存在差异,对抽样的影响是不一样的,这涉及到了样本代表性的问题。如果数据的缺失完全是随机的,丢弃不完整的回答虽然会减少估计的精度但是不会产生偏离。相反,如果无回答是故意造成的,或无回答集中于某类特殊群体,那么无回答层与回答层之间就存在明显的非随机性差异,它们之间就不具有相同的数量分布特征,那么仅采用完整数据的样本显然是不能代表总体特征的,这时,数据缺失除了会增加估计量方差外,还会带来较严重的估计量偏差。   在本文中,采用了EM算法来补救缺失数据给微观计量模型回归带来的影响。此方法是根据观测数据的分布对缺失值进行填补,其估计的结果比较准确和有效。本文以农民收入与消费为例,利用EM算法,分别比较了在线性回归模型和二元选择模型的回归过程中,是否对缺失数据进行插补的回归结果。比较结果得出,采用了EM算法后,模型的回归效果要好于直接删除数据法以及传统的均值插补法,此算法在一定程度上消除数据中隐藏的偏向,弥补了回答层与无回答层之间的差异,从而得出更加准确的结论。  
其他文献
随着国际贸易的飞速发展和全球经济的快速一体化,结构性贸易融资作为一种新型的融资手段正日益成为商业银行和贸易商广泛关注的焦点,也是银行国际贸易融资业务未来重要的利润增
上世纪七十年代,孟加拉国的默罕默德·尤纳斯博士创立格莱珉银行,专门为低收入者提供贷款服务,实践证明低收入还贷情况良好,银行步入良性循环,经过三十年的运作,取得了非常好的经济
一位肥胖的患者来诊,主诉39岁,吸烟,血压升高。社区诊所测量136/90毫米汞柱,说是舒张期高血压,而且心率较快(86次/分),餐后血糖也偏高。开始用硝苯地平,但心率更快,很不舒服。后来改用利尿药氢氯噻嗪,血压可控制,但诊所医生说不利于血糖控制,建议用阿替洛尔。问我究竟该怎么用药?  高血压的诊断要求,必须经过连续3次不同日的严格检测,血压均在≥140/90毫米汞柱以上;若要诊断为舒张期高血压,则
机械设计制造是我国工业发展的主体产业之一,决定着我国工业发展的稳定性和创新性.一方面机械设计制造的水平和自动化程度,与人们生活质量和国家发展密切相关;另一方面,机械
美国加州奥克兰市一幢公寓天台上安装的30 kW太阳能系统采用了美国国家半导体公司屡获殊荣的SolarMagicTM电源优化器之后,其发电量增加了22.6%.这幢称为“橡树街之家”(Oak S
单纯性收缩期血压过高,多见于60岁以上的老年患者,以往对这种类型高血压的危害认识不足,认为是年纪大了动脉硬化,自然会出现这种情况。但近年来的研究发现,单纯性收缩期高血压患者,仍有可能会发生一系列的心血管病变及并发症,严重危害病人的生命和健康。  所以,单纯收缩期高血压患者也应积极防治高血压和各种心血管疾病并发症,有效降低血压是防治关键。治疗药物主要是用长效钙拮抗剂来扩张血管,用利尿剂来减少血管内容
早上七点,妈妈就拉着我来到了欢乐谷。我心里别提有多高兴了,因为这可是我第一次来这儿!走进欢乐谷,当我瞧见眼前的游乐设施时,兴奋劲一下就没了,反倒害怕了起来。妈妈拉着我
产业结构的合理化和高级化是决定经济增长的一个重要因素。大量实践表明,金融通过作用于产业结构变动的内在机制对产业结构的调整产生重要作用,产业结构的调整、优化、升级离不
期刊
2017年9月5—8日,在京举行的第17届国际消防设备技术交流展览会(China Fire 2017)上,由多家消防车生产企业基于中国重汽汕德卡、HOWO-T、HOWO美系风格四门底盘改装的近30款各
期刊