含异常值的抽样调查数据估计方法比较研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:jonay123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在抽样调查中,参数估计是非常重要的环节之一,参数估计效果的好坏,直接影响着整个调查的质量。实际的抽样调查数据中往往存在着异常值,异常值会对传统的估计方法造成很大的影响,使估计结果变得很不稳定,从而导致整体的估计效果变差。对于调查数据中的异常值,有些并不是由于记录错误等人为原因产生的,而是数据自身特点的客观表现。这种异常值往往包含着重要的系统信息,在估计时不能简单的将其删除。因此需要寻找一种新的统计推断方法,在使用这种统计方法进行推断时,异常值不至于对总体推断产生过大的影响。这种方法就是稳健统计方法。  稳健估计的基本原理是,在估计的时候,对异常值赋予较小的权重,使其对估计结果的影响变小,从而提高估计的稳定性。然而,稳健估计会导致一些样本信息的损失,使估计结果的偏差变大。综合考虑偏差和方差两个方面,传统的估计方法和稳健估计方法孰优孰劣,就成为一个需要研究的问题。  本文首先通过模拟方法,比较了在不同总体分布、不同异常值类型、不同异常值比例、辅助变量和目标变量不同相关程度、不同抽样方法等15种情况下各种估计方法的估计效果,然后结合我国贸易信贷调查项目进行了相关的实证研究。  本文的主要结论如下:  (1)当总体服从偏态分布时,稳健估计的估计效果不如传统估计量,但随着偏度的增大,相对于传统估计方法而言,稳健估计的估计效果有变好的趋势。  (2)在总体分布为正态分布、样本中异常值比例为2%的条件下,无论异常值为代表性异常还是非代表性异常,从整体估计效果来看,稳健估计量都要比传统估计量更具优势;对于非代表性异常来说,这种优势更加明显。  (3)在总体分布为正态分布、样本中异常值为代表性异常时,随着样本中异常值比例的增大,稳健估计量相对于传统估计量的优势越来越明显。  (4)当总体的主体分布为正态分布、样本中异常值为代表性异常、异常值比例为1%时,随着目标变量和辅助变量相关程度的增大,稳健估计相对于传统估计的优势越来越明显;由于比估计的RMSE随着相关程度加大而减小的很快,因此在相关程度为0.8的情况下,稳健估计的效果不及传统的比估计。  (5)当总体的主体分布为正态分布、异常值为代表性异常、异常值比例为1%、目标变量和辅助变量相关系数为0.8时,采用层数为六的分层随机抽样,并使用分层比估计量时的RMSE最小;当采用PPS方法时,稳健回归估计能够表现出明显的优势。  (6)不同的稳健估计方法其效果也是不同的,综合来看,Hampel估计要比Huber估计效果更好,但即使对于Hampel估计来说,选择不同的细调参数,估计效果也会不同。  (7)对于贸易信贷调查项目,虽然辅助变量和目标变量的相关程度较低,但借助辅助变量进行分析,得到的结果仍然比不借助辅助变量时要好;在借助辅助变量进行估计时,使用PPS方法,同时使用Hampel M估计量所得到的结果是最好的。
其他文献
虽然基于计算机网络与多媒体技术的第三代远程学习——网络学习已取得了很大成功,但是它较传统学习方式存在更加严重的学生沉淀(dropout)现象。对沉淀学生的预警成为远程学习
本文在资源型城市转型理论和经验研究的基础上构建低碳转型指标体系,对辽源市资源效率、环境效率、能源效率和二氧化碳排放效率的转型效应进行评测,并对转型驱动力进行回归分析
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
作为实施"走出去"战略不可或缺的重要工具,关于中国企业对外直接投资的研究一直是理论和实践具备双重意义的重大命题,在对外直接投资高速发展的今天,中国企业所得税政策对其的影
研究不同紫花苜蓿品种晚秋和早春时期根部非结构性碳水化合物含量的季节变化动态,以期为当地紫花苜蓿推广应用提供理论依据。以国内外12个紫花苜蓿品种为试验材料,通过测定其
“9O后”一代是中国经济快速发展、社会转型背景下的独特产物,他们的思想行为既受中华民族传统文化的影响,又集中体现着中西方文化的冲突与融合。为及时了解和掌握大学新生入校之际的思想状况及其发展动态,进一步增强学生思想教育工作的实效性和针对性,我在过去的一年中对药学院2009级的学生进行了思想政治状况问卷调查。药学院75期共有学生589人,发放问卷共589份,收回586份,有效问卷581份,回收率达99
传统的构建系统发育树的方法依赖于序列比对。但是序列比对的方法有许多不足:共有基因的选择具有一定的随意性;核苷酸和氨基酸打分矩阵没有统一的标准;对于进化距离较远的序列的
英语写作考查学生综合运用语言的能力,是高考试题中相对较难的部分,它要求学生从简单的语言输出上升到用自己的语言组织成一篇内容充实、语句正确、句子连贯的作文。在教学过程中,我们应该注意让学生去写不同形式的文章,注意灌输给学生不同的写作技巧,这样才能提高学生的写作能力。  一、注意遵循写作的流程  第一步:确定体裁,掌握格式  必须让学生明确常见的几种文体和格式,近几年高考卷中的写作,主要是关于记人、叙
针对现有微粒群算法在动态优化问题中容易陷入局部极值问题,提出了一种改进的动态微粒群算法——AVPSO。AVPSO用所有微粒局部最优值的平均值来代替全局最优值,通过有目的的重