论文部分内容阅读
随着城市化的发展,人们的生活越来越依赖于丰富多样的资源,例如交通资源、土地资源、能源等等。通常这些资源总量都由多个固定站点所包含的资源量组成。人们的生产生活方式造成了这些资源随着时间的变化出现空间分布的变迁,导致在某些时刻某些站点的资源总量无法满足人们的需求量。通过对多固定站点资源使用需求进行预测,可以提前发现出现供不应求现象的时间和站点,从而解决这一供需失衡问题。资源需求包含时间和空间两种维度的属性,属于时空数据的范畴。本文以共享单车系统的使用需求为例进行研究,基于车辆使用和站点所在地区气象等历史信息,通过对时空数据预测问题中常见方法进行改进,来预测目标时刻某个站点或某些站点的单车需求量。论文的主要工作在于:1.提出了一种基于地理位置信息和使用模式信息的站点聚类算法。聚类算法是预测过程中对部分站点使用需求进行分析的基础。不同于已有的仅使用站点地理位置信息的聚类方法,本文中的站点聚类还考虑到不同站点使用模式之间的差异。聚类过程中将地理位置信息和从历史数据中分析得到的使用模式信息综合考虑,使用了迭代式结构使聚类结果更加稳定,且利用标签传播算法的思想对聚类结果进行修正。通过实验设计,将该聚类算法与其他已有算法进行对比发现,本文中使用的聚类算法可以获得更加均匀且边界明确的聚类结果,同时该聚类结果也有助于后续预测算法精确度的提高。2.提出了共享单车站点中车辆使用量的分层预测结构。在对站点单车使用量进行预测时,与传统的直接预测方法不同,本文使用的预测结构首先利用梯度提升回归树算法来预测各站点使用量。然后根据不同站点集合的单车使用量在历史数据中占总体使用量的比例,结合站点聚类结果,计算目标时刻各个站点集合的借出量。接着通过站点集之间共享单车的流动模型分析车辆转移概率,计算每个站点集合在目标时刻的单车归还数量。通过与现有文献中预测方法进行对比发现,该分层预测结构在总体使用量预测和类级使用量预测上都可以获得更加精确的预测结果。3.通过时间特征筛选和空间特征提取提高了预测精度。在对特征数据进行分析后,利用组合优化的思想剔除冗余时间特征,并运用卷积操作从历史数据中提取隐含的空间特征信息。最后通过将筛选后的时间特征和提取出的空间特征相结合,对共享单车需求问题进行预测。实验表明,在进行这一系列特征操作后,预测结果相较原始预测方法在预测精度上有所提升。