大数据背景下网络调查样本的随机森林倾向得分模型推断研究

来源 :统计研究 | 被引量 : 0次 | 上传用户:wuusir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据与互联网技术的迅猛发展,网络调查的应用越来越广泛.本文提出网络调查样本的随机森林倾向得分模型推断方法,通过构建若干棵分类决策树组成随机森林,对网络调查样本单元的倾向得分进行估计,从而实现对总体的推断.模拟分析和实证研究结果表明:基于随机森林倾向得分模型的总体均值估计的相对偏差、方差与均方误差均比基于Logistic倾向得分模型的总体均值估计的相对偏差、方差与均方误差小,提出的方法估计效果更好.
其他文献
以自我决定理论(SDT)为基础,640名在校大学生为被试,采用自我决定动机量表(BREQ-2)等工具进行测量研究.结果 发现时间管理倾向在自我决定动机和锻炼习惯之间起着部分中介作用.所以,加强自我决定动机的培养,增进时间管理意识,从内部机制提升大学生的锻炼兴趣,进而可以达到培养锻炼习惯的目的 ,对大学生锻炼习惯的养成具有积极意义.
在现代企业制度下,科学的管理层激励机制设计将有助于鼓励职业经理人加大技术创新投入,而董事会专业权威也将有助于弱化管理层利用信息优势减少技术创新投入的可能性.民营企业产权“天然劣势”使得管理层薪酬规模与企业技术创新投入正相关,董事会年龄相对优势所展现的专业权威对管理层持股比例与民营企业技术创新投资投入具有显著正向调节作用,而且董事会受教育水平相对优势所展示的专业权威对管理层薪酬与民营企业技术创新投资投入具有显著正向调节作用.
新时代,加强党员、干部的忧患意识教育是提升国家治理能能和治理水平的重要组成部分.所以,必须在坚持唯物辩证法的基础上,积极探索符合时代特征和党员、干部忧患意识教育的方法.具体路径为:遵循先忧与后乐相统一、忧患与图强相统一、思忧与除患相统一的基本原则;从明确基本思路、深化教育内容、创新方式方法、加强制度保障等方面下功夫;积极推进党员、干部忧患意识教育向纵深发展.
清代天津文庙祭孔祀典以丁祭释奠礼最繁缛、最隆重,也最重要.天津文庙的释奠礼经历了清初恢复、清中期兴盛、清末由中祀升为大祀的全过程.文庙的建立及举办祭孔释奠礼乐,是封建统治者“德化天下”的举措,对天津社会生活和文化习俗发生过重要影响,成为天津社会文化发展的历史见证.
“南侨诗宗”邱菽园(1874-1941年)于1922年由康有为出资印订的诗集《啸虹生诗钞》,共七卷.该诗钞是马华文坛第一部独立刊刻的个人汉诗诗集,也是新加坡较早的诗词作品,内容覆盖极广,包含历史人物、南洋风俗、作者自身经历等.值得注意的是,其中的诗作多与女性相关,记录了邱菽园宴饮唱酬、冶游赋诗的南洋文人生活情景.《啸虹生诗钞》中的风月诗,既是地方风俗化图景的展示、私人空间的书写,又抒发了对边缘化女性的关切,表现出邱菽园诗歌中的文化建构意识.
本文利用世界投入产出表测度了2001—2014年中美双边增加值贸易结构.结果表明,中国在双边贸易中的单位出口获利能力低于美国,国际分工地位的差异使得两国的贸易结构显示出较强的互补性.在对增加值贸易构成分解的基础上,本文识别并分析了国际生产网络体系下影响出口国内增加值的主导因素及其作用机制.研究发现,网络外最终需求、生产网络上游因素分别是推动中国和美国出口国内增加值扩大的主导因素.此外,产业层面的研究结果显示,中国高技术制造业出口国内增加值的扩大主要是由生产网络上游因素驱动的,生产网络外最终需求则是中国传统
人力资本是经济增长和社会变迁的重要影响因素,但经验研究中如何估计这一指标却存在很大分歧.本文遵循一阶马尔可夫过程,并基于大规模微观个体抽样数据所得关键参数的分布特征,模拟和测算了我国1950—2020年间全国和各地区各年份人力资本存量及人均人力资本水平,并从人口转型和教育提升两个角度考察70年间人力资本变迁的内在机制.研究发现,首先,不同标准所得人力资本存量的增长速度存在较大差异,但均随时间推移不断趋缓;人口转型相比于教育提升在70年间的贡献略大.早期人力资本存量增加主要源于人口转型所实现的人口红利,而近
本文提出了以各类统计数据和国民经济核算数据为核心的编制时间序列投入产出表的方法,充分利用国家统计局及其他官方数据源,以国家统计局编制投入产出延长表的方法为基础、以必要的数学方法为辅助.该方法的优点一是编表方法与国家统计局保持内在一致性,数据上能更好地与官方表形成补充和进行衔接;二是充分利用各级部门公布的统计信息,使得所编制的投入产出表能更好地反映编表年度的经济实际.本文利用该方法编制完成我国1981—2018年期间的序列投入产出表,并与已有文献中的几类我国序列投入产出表进行了比较分析.
近年来,越来越多的企业选择以低廉或免费的价格为居民提供互联网服务,但产出价值和消费行为却无法在GDP核算中体现.服务业产出被低估一直为学术界所讨论,在此背景下,互联网经济下创新的免费商业模式对传统核算理论的挑战成为本文研究切入点.本文在"互联网免费服务与顾客价值"的易货交易框架下对其价值核算展开研究,将互联网免费服务价值核算与数据资产核算联系在一起,使数据成为连接互联网免费服务与国民经济核算中生产、消费、收入核算的桥梁.文章最后通过模拟核算案例表现了互联网免费服务核算对不同账户的影响,建议对住户部门的生产
在完全竞争市场假设下,不同地区资本回报率应趋向统一.基于这一前提,本文首次将微观数据汇总到地区层面,借鉴"价格法"的思想,基于"市场形成价格,价格引导资源配置"提出资本要素市场分割测算方法.本文使用1998—2013年的工业企业数据库,分别在省份、地市层面测算工业、重工业、轻工业、高端装备制造业、高技术产业、战略性新兴产业、装备制造业的全国资本要素市场及省份内资本要素市场的市场分割程度.研究发现,第一,整体来看,1998—2013年各类资本要素市场分割程度大幅度下降,下降幅度在50%左右,其中高端装备制造