【摘 要】
:
我国城镇登记失业率指标稳定在4%左右,难以较为准确反映就业动态;而劳动力调查样本量有限,城镇调查失业率对省以下各级行政区域代表性不足.本文将针对大数据的机器学习算法与针对传统统计数据的核算思想结合起来,基于某四百万人口城市2016—2018年的全样本行政大数据,利用机器学习算法,对每个城镇居民每个月的就业状态进行预测,再利用统计核算方法,估计出该城市的失业率.在个人层面,本文的模型在样本外测试集上的准确率达到96.7%.经过统计核算加总,本文估计的当地失业率在合理区间范围内,并表现出明显的周期性特征,对就
【机 构】
:
中国科学技术大学宾夕法尼亚州立大学普林斯顿大学中国科学技术大学智慧城市研究院(芜湖)
【基金项目】
:
国家自然科学基金专项项目"大数据环境下面向宏观经济风险的审计监测预警研究"(71950011);国家自然科学基金面上项目"面向机器学习任务的优化建模与算法研究"(11871447);
论文部分内容阅读
我国城镇登记失业率指标稳定在4%左右,难以较为准确反映就业动态;而劳动力调查样本量有限,城镇调查失业率对省以下各级行政区域代表性不足.本文将针对大数据的机器学习算法与针对传统统计数据的核算思想结合起来,基于某四百万人口城市2016—2018年的全样本行政大数据,利用机器学习算法,对每个城镇居民每个月的就业状态进行预测,再利用统计核算方法,估计出该城市的失业率.在个人层面,本文的模型在样本外测试集上的准确率达到96.7%.经过统计核算加总,本文估计的当地失业率在合理区间范围内,并表现出明显的周期性特征,对就业形势动态变化的刻画明显优于当地一年发布一次的登记失业率数据.本文基于个人层面的预测结果,进一步探讨了当地失业人口的性别与文化程度特征,以及再就业的时间规律.本文针对如何使用行政大数据辅助经济决策提出了新的范式,对大数据时代如何理解经济与制定政策具有参考意义.
其他文献
21世纪以来,随着大数据技术的快速发展和广泛应用,结构化和非结构化数据等新型研究数据大量涌现,数据科学越来越受到各界关注.数据科学扩展和延伸了传统经济统计的研究深度,也为现代经济统计研究带来了新的机遇和挑战."十四五"规划明确提出,我国经济进入新发展阶段,推进统计现代化改革势在必行,诸如机器学习等数据科学的新技术、新方法正在逐步改进经济统计的研究方法,为传统经济统计研究注入新的活力,有助于促进现代经济统计研究的进一步发展.
由中国统计学会主办,北京大学统计科学中心、北京大学数学科学学院联合承办的第二十一次全国统计科学讨论会拟于2021年11月召开.具体会议时间、地点另行通知.本次会议主题为"统计现代化改革与统计学科发展".现面向社会各界征集论文,欢迎统计系统、高等院校、科研院所、公司企业踊跃提交参会论文.
1.参考文献须"实引".确保正文中引用和文后列出的参考文献在总量上一一对应,总数尽量不超过30条.2.正文中引用格式为"文献作者名(年份)"或"(文献作者名,年份)".若文献有2位作者,引用格式为"甲和乙(年份)"(英文名用"A和B(年份)");若文献有3位及以上作者,引用格式为"甲等(年份)"(英文名为"A等(年份)").A和B均为作者姓氏.多篇参考文献之间以分号分隔.
《调研世界》月刊依托全国统计系统庞大的调查和科研力量,坚持调研与实践融合,调研与创新互动,调研与成果共享,是调查信息的发布载体,科研成果的交流平台,决策管理的重要智库.《调研世界》的办刊宗旨是:谋事之基,成事之道——从调查中来,到调查中去,服务政府统计发展.刊出的内容主要以各类统计调查分析、研究报告、科研成果为主,涵盖各种调查方法、方案设计和调查理论、制度建设、能力评价等内容.《调研世界》创刊于1988年,每月15日出刊,大16开,内文80页,国内外公开发行.
《统计研究》是中国统计学会主办的学术刊物,国内外公开发行.自1984年创刊以来,在广大作者、读者的关心支持下,逐渐形成了自己的办刊特色,成为统计领域最具权威性和影响力的理论刊物.近年来,随着社会主义现代化建设和统计事业的发展,《统计研究》作为"交流科研成果,繁荣学术研究,创新理论知识,推动实际工作"的窗口,密切反映着统计学术的新动向和新思维,在学术领域的宣传和引导作用显得愈发重要.
为加强海峡两岸学术交流,中国统计学会、中国现场统计研究会、中国数学会概率统计学会、中国统计教育学会和中国台湾"中华机率统计学会"决定共同举办第十二届海峡两岸统计与概率研讨会,经初步研究,会议拟由山西财经大学承办.现将征文有关事项重新通知如下:一.由于疫情原因,原定2020年举办的海峡两岸统计与概率研讨会没有如期进行,经初步协商,拟定于2021年继续召开,2020年已提交的符合相关要求的参会论文仍然有效.
《统计研究》是中国统计学会主办的学术刊物,国内外公开发行.自1984年创刊以来,在广大作者、读者的关心支持下,逐渐形成了自己的办刊特色,成为统计领域最具权威性和影响力的理论刊物.近年来,随着社会主义市场经济和统计事业的发展,《统计研究》作为"交流科研成果,繁荣学术研究,创新理论知识,推动实际工作"的窗口,密切反映着统计学术的新动向和新思维,在学术领域的宣传和引导作用显得愈发重要.
分享经济作为一种新兴经济,社会各界对其认知存在显著差异,导致有关核算研究及统计实践面临诸如定义、生产范围界定、统计分类、估价和增加值估算等问题.为此,本文立足于理论与实践的角度,结合各方面研究归纳出分享经济的本质,一种有偿暂时性让渡闲置资源使用权的市场性分享活动,这种活动在互联网通信技术,尤其是分享平台的助力下,进入了规模化发展阶段.同时,利用SNA的生产观点归纳出分享经济的生产与产出统计范围,并对相关统计分类方法和标准进行了探讨.最后,针对分享经济估价问题提出了有关估算方法.本文的创新在于提出了分享经济
我国现有的行业层面就业统计数据不甚充分,且在统计对象、核算方法和行业分类等方面缺乏统一性,导致我国各年份行业层面就业数据可比性较差.为准确核算一套可比的行业层面就业数据,本文厘清就业数据的不同核算口径,提供不同口径转换统一的方法,基于最新《国民经济行业分类(GB/T 4754—2017)》标准,测算1990—2018年97个行业大类就业数据,并证实测算结果的合理性;在此基础上,本文测算行业层面劳动生产率,进行行业分布和劳动生产率的国际比较.结果显示,本文核算出1990—2018年97个行业大类的行业层面就