论文部分内容阅读
绝大多数国家或地区定期进行人口普查,以获取人口统计数据,掌握人口发展现状和变化规律。人口普查的质量对人口普查工作具有重要意义。人口普查质量评估是人口普查工作的重要内容。人口普查的组织与实施包含多个工作阶段,每个阶段都会不可避免地产生误差。其中,普查登记阶段的误差最难以控制,对普查质量的影响尤为重要。各国政府统计部门都把人口普查的登记质量作为其最主要的评估对象。人口登记漏报、人口登记多报和人口登记错报是影响人口普查登记质量的主要因素。与此相应地,人口普查登记质量评估分为覆盖误差评估和内容误差评估两部分。覆盖误差评估包括人口普查净误差估计、普查多报人口数和漏报人口数估计。内容误差评估侧重对人口统计特征等登记内容的一致性和差异性的检验。由于覆盖误差关系到全国真实人口总数的估计,因而是人口普查登记质量评估的重点。从世界各国人口普查登记质量评估实践来看,常用的登记质量评估方法主要包括事后计数调查、人口统计分析模型、逆记录检查、普查重复研究和行政记录比较这五种。其中,事后计数调查可以同时完成人口普查净误差估计、普查多报人口和漏报人口估计以及内容误差估计。以美国、瑞士、澳大利亚、新西兰、乌干达等为代表的大多数国家都使用事后计数调查评估人口普查的登记质量。中国国家统计局在人口普查后也使用事后计数调查评估普查登记质量,构建以捕获-再捕获模型为基础的双系统估计量估计全国真实人口总数,进而计算普查净误差。但中国国家统计局在构建双系统估计量时主要存在三方面的缺陷。一是没有使用事后分层方法来满足模型的同质性假设条件。二是没有考虑普查与事后计数调查之间客观存在的人口移动问题。三是没有使用刀切法计算估计量的方差估计。概括来看,相比以美国为代表的许多国家,中国的人口普查登记质量评估理论研究与实践工作历史较短,欠缺扎实的基础理论研究,没有形成科学可靠的人口普查登记质量评估方法体系。有必要特别提及的是,中国一部分人口学者的人口普查登记质量评估的研究成果也存在缺陷。例如,其评估对象并不是原始的普查登记数据,而是经过调整的普查登记数据。又如,其使用的评估方法完全背离了各国统计局所使用的人口普查登记质量评估的主流方法。再如,他们混淆了人口普查净误差、普查多报人口和漏报人口等最基本的概念,引起了理论研究的困惑以及实践中的指标滥用。针对国内人口普查登记质量评估研究中存在的诸多问题,本文的研究目标是,通过解读国际前沿的人口普查登记质量评估研究成果,如美国2000年和2010年的人口普查登记质量评估方案以及联合国事后计数调查指南等工作文件及学术文献,对人口普查登记质量评估研究的基础理论进行深入研究,构建以双系统估计量为核心的中国人口普查登记质量评估方法体系,为改进和完善中国2020年人口普查方案设计提供理论依据。本文的主要研究内容概括如下。(1)对人口普查净误差的统计学本质的研究和论证。净误差实质上是描述人口普查结果这个随机变量散布特征的一种统计特征数,所描述的是人口普查的精确度而不是它的准确度;(2)按人口普查中人口不同登记状态计数得到的各种指标,包括这些指标的概念、指标体系梳理、指标之间的平衡关系;(3)样本数据的采集及处理,包括编制住房单元地址目录、用所编制的住房单元地址目录与普查时编制的住房单元地址目录进行比对、对匹配住房单元中的人口进行个人调查和匹配性比对;(4)捕获-再捕获模型的统计学原理,包括模型的试验背景、估计量及其无偏性、模型的应用条件;(5)人口普查登记质量评估中的双系统估计量,包括双系统估计量与捕获-再捕获模型的对应关系、双系统估计量无偏的条件、满足无偏性的措施;(6)对人口总体进行登记概率同质性分层,包括分层变量的选择、抽样后分层条件下的双系统估计量;(7)人口在普查日过后发生移动条件下的双系统估计量;(8)人口普查登记质量评估工作中有限总体概率样本的抽取,以及用此种样本构造双系统估计量的估计量;(9)人口普查多报与漏报人口数估计、内容误差估计;(10)数值模拟,包括抽样权数计算、人口数目的双系统估计量、刀切法方差估计量,等等。