论文部分内容阅读
微时空粒度在本文中代表一个相对的概念,其指采用的时间与空间粒度均相较于传统研究更加精细。活动人口预测可理解为人口预测的一种,特指针对在给定时间与空间中出现的人口数量进行预测,如未来某小时、某主题公园内的游客数量。微时空粒度下的活动人口预测,对精细化城市管理、应急灾害响应等有重要的现实意义。以往受信息采集方式的限制,预测方法多基于人口普查或统计年鉴等,对人口研究的测度较为宏观,难以充分表征活动人口的变化情况。伴随信息时代的到来,粒度精细且样本完整的新型数据采集方式的出现,如手机信令等,为研究提供了丰富素材和新的解决途径。但是传统的人口预测方法并不擅长处理此类大规模、采样粒度精细的数据,且现有学者较少能同时从时间和空间两个角度深入地挖掘数据内部特征,因此结合数据自身的特性,在借鉴现有研究的基础上,为实现时空粒度更加精细的活动人口预测,本文提出一种集成长短期记忆神经网络(Long Short-Term Memory,LSTM)与元胞自动机(Cellular Automata,CA)的方法,并以上海市崇明区联通手机信令数据为例,验证方法的有效性以及在不同场景下的适用性。该方法在空间上将研究区划分成规则的格网单元,利用CA模型提供的邻域单元交互机制反映活动人口的移动特征,同时借助LSTM模型实现时间序列上基于格网单元的活动人口预测。本文的研究主要分为三个部分:(1)对现有人口预测方法及手机信令数据研究进行介绍和归纳;(2)针对研究目标和研究对象,提出整合LSTM与CA的数据驱动(Data-driven)型活动人口预测方法;(3)利用中国联通采集的上海市崇明区手机信令数据,构建该区域联通手机用户的人口预测模型,并设定多种场景,对预测结果进行定量评价。实验中通过分别控制时间的长度和粒度以及空间上邻域的不同构建方式,共计训练出六个人口预测模型。结合案例数据,得出的预测结果表明所提出的集成模型可取得较好的预测效果,其中利用三日数据(平常日期)、1小时时间粒度、结合路网信息计算邻域元胞权重,训练得到的预测模型泛化效果最好,其平均绝对误差(Mean Absolute Error,MAE)指标小于1。说明该模型在微时空粒度活动人口预测方面具有较好的适用性。本研究区别于以往相关研究的创新之处在于通过集成LSTM和CA两个模型,综合时空两个维度以充分挖掘人口短时空间分布特征,并得出考虑空间差异性的活动人口预测结果。特别地,本文还提出了一种融合路网信息确定CA模型中元胞权重的算法,可进一步提高预测精度。