多级汇总数据中计量误差效应的识别与控制

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:yaoyao2048
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来国内外社会各界对统计数据质量问题日渐关注,而准确性是统计数据质量的核心特征,在政府统计数据以及大型社会调查如人口普查和经济普查中,都有对数据准确性进行评估的迫切要求。就数据本身而言,统计数据的准确性问题本质上就是误差问题。论文以统计调查中的计量误差作为研究的着眼点,在统计抽样理论的范畴内探讨以误差参数来表征现实中影响数据准确性的各种来源的可能性,围绕各项计量误差参数的估计与应用展开研究,力求从方法论层次上对统计数据准确性的评估研究取得突破,进而指导宏观统计过程中的误差控制。  论文以“多级汇总数据中计量误差效应的识别与控制”为题进行研究。所谓多级汇总数据是指通过将基层单位数据经过逐级汇总得到总体总量指标的数据结构。在每一级数据汇总中,都有可能引入新的计量误差,并且某一汇总单位所属的下级单位中的计量误差存在相关性,因此汇总的数据会或多或少受到计量误差的影响,即便是全面调查也不能幸免。普查与我国政府统计数据都可以列入多级汇总数据的范畴。  围绕多级汇总数据结构研究计量误差效应识别与控制的技术策略,既是对现有统计调查方法与非抽样误差理论研究领域的一大拓展,也促进了调查误差研究与统计调查质量管理理论的融合;论文将计量误差发生机制与抽样理论相结合,对基于统计模型的抽样设计理论也会有所促进。同时,论文研究可以唤起各类统计调查机构对计量误差的重视程度,为统计调查数据质量评估的精确化、可行化奠定基础;从调查误差角度揭示导致数据质量低下的根本原因和产生统计调查误差的主要来源,为改革和完善统计调查制度、方法与工作流程提供参考依据、为进一步开展的统计调查数据质量控制指明方向。  论文研究内容主要包括四个部分:一是构建多级汇总数据中的计量误差模型;二是基于该模型探讨计量误差对多级汇总数据准确性的影响(计量误差效应),提出几种可以表征计量误差效应的误差参数;三是探讨对计量误差效应进行识别量化的可行性,基于两阶段抽样获得的准确样本数据,构造误差参数的估计量;四是以误差参数的估计信息为基础,讨论对多级汇总数据中计量误差效应进行控制的若干策略。  论文研究结构如下:第2章首先界定多级汇总数据的概念与数据结构,结合普查与政府统计的实际情况,分析其中计量误差发生的机理与特性,在此基础上对多级汇总数据中的计量误差机制进行建模,设定关于计量误差的条件均值和相关性在内的若干假设,这些假设构成论文以后各部分研究的前提条件。同时,对计量误差的量化技术和准确数据的获取方法进行对比分析,探讨适用于多级汇总数据研究的方法;论述了超总体与基于模型的推断方法,为下文的进一步研究奠定了方法论基础。  第3章分析多级汇总数据中计量误差的影响效应。首先提出多级汇总数据准确度的概念,以均方误差形式来表现计量误差所导致总量结果中的偏差和变异性,提炼出衡量计量误差规模的若干参数,包括计量偏差、简单计量方差、相关计量方差、初级单元组内相关系数以及计量可靠性比率,不同参数具有不同的现实意义。其次分析了利用实际汇总总量结果计算总体分布(以总体一阶矩与二阶矩表征)时所遭受的扭曲。再次基于对两变量相关程度受计量误差影响的分析,探讨传统含辅助信息的抽样估计方法(比率估计、回归估计与不等概率抽样)在辅助变量中包含计量误差的情况下,估计精度所受到的减损。  第4章讨论了利用重复抽样调查所得准确样本数据估计各项计量误差参数的方法。为分析简单起见,仅讨论多级汇总数据中初级单元规模相同或相近的情形,假定采用多阶段简单随机抽样,通过更为严密的操作规程、在更理想的调查条件下获得了准确的样本数据。利用两套数据,构造了基于抽样设计的两类计量偏差估计量,即线性无偏的估计量和以初始汇总数据作为辅助变量的两阶段比率估计量;基于第2章关于误差机制的假设推导出了计量方差成份的估计量;同时探讨了混合效应模型在计量误差效应估计中适用性。最后通过数值模拟研究比较验证各种估计方法的效率。  第5章假定在各项计量误差参数已知的情况下,探讨对多级汇总数据中计量误差效应进行控制的策略。首先基于计量误差效应模型来分析统计汇总方法的取向问题,对含误差的全面调查与“准确完美”的抽样调查的效率进行对比分析,确定了对两种方法进行取舍的误差—成本临界点。其次讨论数据汇总体系结构对于误差效应的影响,提出利用交叉汇总来降低计量方差的设想,确定可以使误差—成本效率达到最优的初级单元规模和交叉汇总维数。再次探讨统计数据生成过程中各参与方之间所进行的博弈,基于博弈分析方法来寻找可以有效控制数据误差的政策变量。  第6章属于论文研究的总结部分,归纳出若干结论性文字;同时对论文研究的不足之处进行分析,对今后的研究方向加以展望。  论文的首要创新在于针对由普查和我国政府统计实际情况所归纳的多级汇总数据结构,引入误差分析思想来研究统计数据准确性的评估与控制问题。具体体现在:1)提出全面汇总数据准确度的概念,推导出了可以表征汇总总量准确度的均方误差公式,二者是对统计数据准确性(或可靠性)概念的明晰化;进一步,由均方误差提炼若干计量误差效应参数,不同的参数暗示了现实中计量误差的不同来源。2)实现了基于重复调查准确数据对计量偏差和计量方差成份的同时估计。3)在讨论计量误差效应识别估计的过程中,构造了多种新型的总量估计量和计量方差成份估计量,可分为多阶段抽样下含辅助信息的估计量与基于混合效应模型的估计量,推动了辅助信息在多阶段抽样中的有效应用。数值模拟研究结果表明,各种估计量都能满足近似无偏性,估计效率也远高于线性无偏的简单估计量。4)提出利用计量误差效应识别结果对后续多级数据汇总过程进行误差效应控制的若干策略:综合考虑估计精度与调查成本两类因素,确立了在统计汇总中对“不完美”全面汇总与“完美”抽样调查进行选择取舍的标准;确定了初级汇总单元的最佳规模,提出使初级单元与汇总单位相分离、同级单位交叉汇总的构想;拓展了统计数据生成过程中博弈分析的理论,重新界定了相关政策变量的有效性。
其他文献
由中国国家画院、甘肃省文化厅主办,中国国家画院创作研究部、中国国家画院美术馆、中国国家画院美术研究院、中国国家画院艺术信息中心、甘肃画院承办的“新中国美术家系列
本文以2001年4月至2005年4月期间董事会首次公告发行可转债议案的116家上市公司为研究样本,运用事件研究方法对可转债发行公告的市场效应进行了实证研究。实证结果显示,可转债
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
采用连续浸提法研究油菜体内铜和锌的化学形态。在幼苗期,各种化学形态的铜和锌主要在地下部积累,向地上部的转运相对较少。铜在幼苗体内以活性较强的水溶态和醇溶态为主,锌在幼
中国资本市场已经发展了十几年,其中股票市场在经历了最初的躁动之后近年来陷入沉沦,而可转换债券作为一种新生的金融衍生产品,其市场开始蓬勃发展起来。可转换债券是固定收
对于矿山厂矿中,机电设备是使用比率最大的设备之一,尤其是目前矿上、山生产实现现代化以来,机电设备的使用比例还将有大幅度提高,由于矿山生产区域作业条件较为恶劣,机电设
营造和谐、健康、持续的企业廉洁氛围,必须贴近企业、贴近实际,采取多样化廉政教育的形式,抓好领导干部和“三重人员”(重点区域、重点岗位、重点人员)的思想教育,让廉政教育
  本文通过分析REITs在美国、香港、新加坡、日本、韩国等国家和地区的发展历程,重点考察REITs的产品特性,归纳出REITs的发展模式和立法要求,再对我国当前市场条件、经济环境
从高中英语课前导入、课文阅读、课后拓展三个阶段阐述了提高学生阅读兴趣的策略。 From the introduction of high school English before class, text reading, after-sch
期刊
雕塑家韩文华的作品常雕凿出深沉的乐章,表达出对传统的反思、对现实的关照。当代艺术需要一种矛盾的综合体,把当下和历史、传统用一种包容或置换的方式来呈现出来,用以诠释
期刊