基于网络调查样本的倾向得分与插补推断

来源 :内蒙古财经大学 | 被引量 : 0次 | 上传用户:nancyloveme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统基于设计的抽样理论推断在抽样领域中占据着重要地位,例如政府调查、民意调查等各类大型调查一般都选用概率抽样调查,利用样本统计量对总体参数进行推断。然而当前概率抽样调查面临着许多挑战,主要有抽样框的构造变得困难、调查成本高、调查回答率低、以及有效需求样本量不足导致估计偏差增大等。大数据时代背景下基于互联网的网络调查悄然兴起,由于其信息传播速度快、获取数据成本低、便捷性高以及受众人员广的优势,从而以互联网等信息化工具实施的网络调查得到了广泛应用。然而互联网调查的实施过于依赖能够使用互联网的人员,通常不能涵盖目标总体,存在覆盖误差,样本单元的选取不是基于完全随机的原则,样本存在选择性偏差等。另外,网络调查大多采用非概率抽样,其本质上是非概率样本,难以利用传统基于设计的抽样理论推断。关于非概率样本推断有限总体是抽样领域研究的热点问题。本文在可忽略选择机制下提出了推断有限总体方法:一是从伪随机化的视角出发为非概率样本构造伪权数以实现推断。由于非概率样本没有遵循随机的原则,其入样概率未知,样本不具有总体代表性,进而无法推断总体。因此,可以借鉴传统的随机化推断方法,构造伪权数与目标变量结合,实现对总体的估计。其中,倾向得分方法是一种常见的方法。文中主要通过Logistic回归、岭回归和Lasso回归构建倾向得分模型估计非概率样本的入样概率进而推断总体;二是从插补的思路出发通过非概率样本构造概率样本的插补值,利用插补值实现推断。在插补估计中假设概率样本的目标变量不可观测,目标变量的观测值均来自于非概率样本,在满足强可忽略的条件下利用类似传统的回归插补法,通过训练非概率样本模型对概率样本的目标变量插补。文中主要通过岭回归和Lasso回归模型训练非概率样本对概率样本的目标变量进行插补,以实现对总体的推断。本文从模拟和实证方面验证提出估计方法的有效性。其中,模拟分别考虑了未添加混杂变量和添加混杂变量两种情况,实证选取的是2017年中国网民社会意识调查数据,分别利用倾向得分方法和插补方法对目标总体均值进行估计。模拟分析和实证结果表明:从相对偏差、方差和均方误差综合来看,基于插补的总体均值估计要比倾向得分逆加权的总体均值估计效果好,其中,从相对偏差与均方误差角度分析基于Lasso回归插补的总体均值估计效果更可靠。
其他文献
随着我国城市化进程的不断加快,各城市机动车保有量急剧增加,引发的交通拥堵和空气污染等问题逐渐成为社会关注的热点,越来越多的城市管理者开始重视城市交通拥堵缓解与空气污染治理等问题。由于机动车在交通拥堵时尾气排放量增加,大部分城市试图通过采取缓解交通拥堵政策,如增加公共交通供给,达到“治堵”和“治污”的双重效果。轨道交通作为公共交通中运力最大、速度最快的交通方式,因其噪声、交通事故以及空气污染成本均远
学位
在发展进入新常态之后,我国经济开始由数量型发展模式向质量型发展模式不断转变,经济增速开始放缓,实现经济高质量发展是中国处于新时期发展阶段的客观需要,更是我国新旧动能转换、解决不平衡不充分发展的必要之路。那么我国为实现绿色化转型而采取环境规制对于经济高质量发展起到了怎样的作用?环境规制对经济高质量发展,在不同发展水平的省域或地区的影响是否存在异质性?不同环境规制之间是否存在异质性?这正是本文所要探讨
学位
新时代中国经济发展进入高质量发展新阶段,随着经济的高速增长,能源消耗、气候变暖等问题日益严重,对中国生产和生活造成严重负面影响。交通运输业作为中国经济发展的重点行业,理应成为节能减排的重要发力点。对此,已有较多学者从不同角度进行相关研究。交通运输碳排放效率作为连接交通运输业经济发展和生态保护的重要桥梁,综合考虑资源投入、经济发展和污染排放三者的关系,可以有效衡量地区交通运输业经济和环境的关系。环境
学位
改革开放以来我国经济高速增长,经济发展取得了巨大的成就。东部沿海地区凭借着良好的区位优势与工业基础,经济发展迅速,西部地区由于深居我国内陆加之发展基础较弱,与东部地区经济发展有较大差距,为缩小东西部经济发展的差异,党中央提出西部大开政策来推动东西部地区经济平衡发展。西部大开发一定程度上缩小了东西部地区经济发展的差距,然而西部省(自治区)之间也存在着经济发展的差异,如甘肃、内蒙古与陕西经济发展存在较
学位
随着我国城市化进程加快,交通需求量与汽车保有量急剧上升,导致众多城市面临严重的交通拥堵问题,尤其是在早晚高峰期间。为此,剖析通勤者在早晚高峰期间的通勤行为,将为交通管理部门出台缓解交通拥堵的相关政策提供科学依据,无论在理论上还是实际应用中都具有极为重要的意义。随着科学技术的迭代发展,自动驾驶有望成为未来出行的新模式,同时,由于机动车驾驶员可在自动车内从事除驾驶外的其他活动,因此,通勤行为一方面受各
学位
我国经济已实现从高速增长阶段向高质量发展阶段的跨越,党的二十大更是明确高质量发展是全面建设社会主义现代化国家的首要任务,经济高质量发展作为其中重要一环必须在财政的支持下加快实现。内蒙古在改革开放以来,特别是本世纪初,顺应我国经济高速增长阶段的市场需求趋势,充分利用资源禀赋等优势,一度走上了快速发展道路,工业化、城镇化取得了长足进展。随着我国经济的转型,内蒙古也相应地进入了跨越关口和调整转型的关键期
学位
基本养老保险制度是一项关系到民生的重要问题。养老保险费用由政府,单位,个人三方面承担。伴随着我国经济、社会的发展、医疗科技的进步、人们的生活水平的提高,人们的预期寿命也在逐步提高。同时,新生婴儿的数量并没有同步提高。尽管最近几年已经放开了二孩的限制,但是在短时间内,还未见成效。随着人口的增长,我们已经迈入了老龄化的时代,我们的“人口红利”正在逐步消退。随着人口老龄化的加剧,我国社会保障制度的运行和
学位
步入新时代,开启新征程,中国经济从高速发展向高质量发展转变,正值提质换挡重要时期,改善居民消费结构、促进消费升级对于当前阶段中国经济的高质量发展起着至关重要的作用。而技术的进步拓展了金融的边界,近年兴起的互联网数字技术和普惠金融的结合催生了数字普惠金融,数字普惠金融成了时下热门的一个话题。探讨这一新兴领域对中国居民消费结构升级是否及如何产生影响,对我国当前阶段扩大内需、实现发展新动能的转化以及经济
学位
当前我国金融发展水平不断提高,新兴市场快速崛起,市场逐渐形成业务多元化的新发展格局,这在增强市场关联性的同时加剧了风险的扩散蔓延。在外部环境不稳定、内部环境纷繁复杂的背景下,深入研究我国金融资产间的相依结构、精准度量金融市场的风险、科学分析各金融行业的风险溢出效应对新时代中国特色社会主义经济金融建设具有重要的理论意义和现实意义。本文以我国金融市场的相关数据为研究样本,使用因子分析法、DCC-GAR
学位
近年来随着我国不断加强对金融市场的完善和重视,相关理论也不断进行更新和发展。特别是从20世纪60年代的出现,金融市场微观结构理论不断发展完善,并受到全球不同研究者的高度认可,其核心研究内容之一的流动性也受到越来越多的关注。流动性是保障金融市场高效运行的决定性因素。Amihud和Mendelson(2003)曾经强调,“流动性是维持金融市场正常运转的关键”[1]。因此,研究金融市场中流动性的影响因素
学位