基于移动通信大数据的人口流动性测度研究

来源 :山西财经大学 | 被引量 : 0次 | 上传用户:kiry250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人口流动性是经济社会发展的一个重要指标,用来测度人口以流动方式追求经济社会目标而形成的较长时间的自由迁徙和异地生活的状况。依照政府统计口径,流动人口是指在中国户籍制度条件下,离开了户籍所在地到其他地方居住的人口,但目前尚无明确、准确和统一的定义。截止到2016年末,我国流动人口总数约为2.45亿人。经济增长是人口流动的一个重要原因,鉴于流动人口的构成成分复杂、流动周期不确定、流动轨迹多变等原因,我国现有的人口流动性统计存在诸多问题,口径统计不一,数据质量参差,不能满足政府和社会的统计需求,流动人口相关的统计方法和相关制度都亟待改进。本文基于移动通信运营商的即时通话记录数据,以人口行为学特征为基础,从移动通信大数据所表征的用户行为对人口的流动性进行判断和测度,在对流动人口概念进一步界定的基础上,设计了一种将基于机器学习算法构建的流动人口识别模型和基于捕获再捕获抽样构建的人口流动性测度模型相结合来对流动人口规模进行估计的方法。在基于机器学习方法构建流动人口识别模型时,通过对移动通信用户流动人口和本地人口通信行为特征的分析构造了流动人口识别特征变量,利用AUC-RF方法进行了特征变量的选择。在此基础上,本文选择了决策树、Bagging、随机森林、支持向量机以及人工神经网络五种算法进行模型的构建,并通过多种评价标准对模型进行评估和选择,最终选择分类性能和泛化能力最优的随机森林模型作为最终的流动人口识别模型,对样本集中的未分类样本进行了分类预测。在构建基于捕获再捕获抽样的流动人口规模测度模型时,实证表明该估计方法能比较准确可靠的对地区流动人口规模进行估计。因此本文得出结论认为,本文设计的基于移动通信大数据的人口流动性测度方法与传统的流动人口调查方法可并行使用,相互补充,相互印证。本文希望在移动通信大数据的基础上,对改进我国流动人口统计调查探索一个基于大数据思想的统计方法和制度,依托同时期的移动通信记录数据,利用科学的统计推断方法,对流动人口的规模和特征进行估计和外推,从而得到更加精确和完整的人口统计数据。实证检验表明,本文设计的方法成本低、速度快、精度较高,非常适合于对我国现行的统计制度进行改进和拓展。
其他文献
通过资产重组聚集相关产业盘活资产存量实现规模经营中国第一汽车集团公司一汽是国家在"一五"期间建设起来的第一家汽车生产企业。进入九十年代以后,一汽自觉地按照市场经济对资
<正>Q最近的热播剧《空巢姥爷》里,你塑造了一个孤独又倔强的老人形象,在追求爱情和对女儿的爱之间,"周老师"选择了对儿女的爱,在这方面你是否深有体会?A最近《空巢姥爷》在
我国目前还没有针对煤矿井下本质安全电气系统的标准,新版IEC 60079-25对I类本质安全系统的技术规定也很不完善。文章给出了本质安全电气系统的概念,分析了煤矿井下爆炸性环
介绍了具迷人色彩的帕拉巴碧玺的产出与市场概况。重点介绍了与帕拉巴碧玺同类的含铜碧玺的宝石学特征及化学组成的属性研究。指出单靠化学成分不能确定含铜碧玺的品种
<正>最近走红的电视剧《芈月传》中,芈月的历史原型就是秦宣太后,有很多文童称她"有男宠,性欲强"。"生性淫荡""狐狸精""天生骚货"……这类以"性"来骂女人的词汇从古至今比比
自动化程度高的机器设备在运行过程中接收到外部信号或指令时可作出实时反应,但其复杂的控制程序因缺乏理论模型而难以设计。通过对有限状态机原理进行数学分析,应用有限状态
通过对甘肃环县近年来的土地利用特点进行分析,找出我国西北部地区典型沙化干旱地区的土地利用共性及在土地资源利用中存在的问题,提出旱区土地资源优化利用的管理要点,认为
化学灾害事故中的有毒气体泄漏事故严重危害公共安全。泄漏事故发生后,有毒气体在单位时间内的扩散范围受多种因素的影响。利用ALOHA软件可以模拟内外因对液氯泄漏事故泄漏范
负债经营是企业在一定风险条件下为追求经济利益最大化,通过银行借款、发行债券以及商业信用等形式吸纳资金,并利用这些资金从事生产经营活动,追求资产保值、增值的一种经营
弱视的定义、分类及疗效评价标准一、定义凡眼部无明显器质性病变,以功能性因素为主所引起的远视力低于0.9且不能矫正者均列为弱视。弱视按程度分:1.轻度弱视:视力为0.8~0.62.中度弱视:视力为0.5~0.23.重