论文部分内容阅读
随着实验科学等众多学科的迅猛发展,科学合理地获取信息对科研工作者具有基础性意义。抽样调查是搜集社会信息的一种科学方法,近年来,抽样调查理论与实践在我国得到迅猛地发展,且己被广泛应用到众多领域。固定样本和重复样本是常用的两种抽样设计,虽然它们各有优点,但在实践中,其不足也逐渐突显。一方面,固定样本和重复样本的使用都不能通过调节样本的结构降低抽样成本。对于每个研究领域,抽样成本是有限的,过高的抽样成本会提高抽样预算,进而影响抽样设计效果。另一方面,由于抽样时间间隔较长,固定样本普遍存在样本流失、样本老化导致的不具有代表性等严重问题,从而影响信息的真实性和可靠性。在轮换样本、分裂样本的抽样设计中,一部分样本随着抽样的时间变化不断地更新,这决定其可以缓解样本流失、样本老化等问题。分裂样本中一部分为固定样本,另一部分为轮换样本或是重复样本,这种结构特质决定其将固定样本、重复样本及轮换样本等优点相结合,并具有应用灵活性和低成本特点。在实际问题研究中,科研工作者可根据实际情况来选择固定样本在分裂样本中的比例,更好地利用有限的预算来满足研究的需要。同时,根据具体需要,还可以选择分裂样本中的部分样本再次使用。因此,针对目前抽样调查存在的提高抽样预算、样本流失和样本老化等问题,本文突破了传统抽样调查理论研究范畴,将固定样本、重复样本研究扩展到轮换样本、分裂样本的研究,从而提高数据质量、降低成本且满足数据高效实用的需求。基于此,本文对轮换样本、分裂样本抽样设计的四方面问题进行了深入地研究:其一,在抽样调查过程中,为了使用有限数据信息得到更高精度的参数估计,本文基于方差分析模型,从三种不同参数形式分别讨论了轮换样本、固定样本、第一种分裂样本及第二种分裂样本的最优选择问题。本文通过数理推导得到了线性最优无偏估计量的方差解析表达式,通过数值模拟分析了每种参数形式下样本的最优选择,不仅为抽样调查提供了抽样设计依据,而且在具体问题研究时更有利于样本的选择。其二,本文在新的视角下,基于方差分析模型,首先讨论了不考虑成本时第一种分裂样本的最优设计,并研究了方差分析模型常见三种形式估计量下的最优设计及样本容量的确定。然后将考虑成本下第一种分裂样本的最优设计转换成标准的非线性整数规划问题。其次,设计了模拟退火方法来求解此非线性整数规划问题。最后,使用模拟退火算法求解分裂样本比例设计时,针对参数选择带来的影响,本文结合一次设计和因子设计的方法进行了敏感性分析。根据敏感性分析得到参数选择原则,并以此来设定参数的取值,进而提高算法的执行效率和收敛速度。其三,本文系统地梳理了国外已有的轮换样本下的估计方法。在此基础上,通过蒙特卡罗模拟方法分析了二分之一轮换样本下广义可行最小二乘估计方法的可行性,模拟结果表明,二分之一轮换样本下广义可行最小二乘估计方法存在过高的过度置信度,样本方差严重扭曲。针对这一方法的不足,本文提出了估计量改进的思路,给出了二分之一轮换样本下的稳健估计方法。通过方差分量的常规性假设及平稳性假设推导了其渐近性质。对估计量有限样本性质的蒙特卡罗模拟表明,与广义可行最小二乘估计方法相比,在保持平均绝对偏差和根均方误差基本不变的前提下,新的估计量从三种不同的程度降低了过度置信度,为二分之一轮换样本下的实证研究提供可靠的估计及科学的预测。其四,本文全面分析我国农村住户抽样调查样本轮换现存的问题,在此基础上将我国具体的国情与连续性抽样理论相结合,为农村新一轮住户抽样调查样本轮换体系提供完善的思路及具体的实施步骤,进而为涉及农村住户实际抽样调查工作提供方法上的指导。综上所述,本文对分裂样本、轮换样本应用与理论的研究,不但补充了连续性抽样调查理论,而且对于建立一套适合我国管理体制的农村住户抽样调查体系具有重要作用。首先,对轮换样本、固定样本、第一种分裂样本及第二种分裂样本的最优选择的问题进行了深入探讨,研究方法和研究结果不仅有助于比较四种样本的优缺点,在具体问题研究时,更有利于进行样本的最优选择。其次,在新的视角下,对第一种分裂样本进行了最优的设计,并且设计了优化方法对其进行求解,从而为第一种分裂样本的使用提供可靠的理论依据。再次,对二分之一轮换样本下的估计方法进行了深入研究,研究结果为二分之一轮换样本下的实证研究提供可靠的估计结果。最后,将轮换样本理论应用到我国农村住户抽样调查中,该应用对完善我国农村用户样本轮换调查体系具有指导作用,并有力地推动了我国农村住户抽样调查的实施。因此,对分裂及轮换样本进行研究具有重要的理论和现实意义。