论文部分内容阅读
近几年城市中的各种传感器如手机,GPS设备等每天都产生大量数据,通过分析城市中的各种大数据来研究和管理城市成为热门的研究方向,城市功能区域划分是其中的一个重要应用。城市功能区域划分旨在利用城市中和位置相关的数据,如兴趣点,人的轨迹和车的轨迹,对城市中具有相似功能的区域进行划分。目前,主流的方法是通过将区域看成文档,将区域的功能看成文档的主题,应用自然语言处理中的主题模型实现功能区域的划分。现有的方法需要人工构造特征,特征的表达能力有限,常用的主题模型如隐含狄利克雷分布基于词袋假设,无法提取移动模式中潜在的上下文语义,而移动模式中的上下文语义和区域的主题之间有潜在联系,因此使用概率主题模型进行功能区域划分具有局限性。本论文主要针对现有方法的缺点,提出改进方案,主要研究工作如下:(1)针对人工构建的特征表达能力不足和现有模型无法提取移动模式上下文信息的缺点,提出引入深度学习框架,利用深度学习自动分层构建特征的强大能力提取轨迹数据潜在的上下文语义。首先构建基于移动模式的区域文档模型,然后使用神经网络主题模型DocNADE主题模型,对区域文档进行主题建模,将划分结果与概率主题模型进行比较,验证基于深度学习的主题模型在城市功能区域划分中的效果。实验结果证明基于深度学习的主题模型的功能区域划分效果接近基于狄利克雷多项式回归的主题模型。(2)针对现有深度主题模型计算量大,对于全局语义把控不足和只能处理单一数据源的缺陷,提出将深度学习和概率主题模型结合的Mobility Pattern Embedded Topic Model(MPETM)框架,通过深度学习中的词嵌入算法得到轨迹模式的嵌入,将移动模式嵌入到低维的向量空间,以获得移动模式中的语义信息和上下文信息,再利用概率主题模型融合基于兴趣点频率密度的元数据,对区域进行主题建模。将概率主题模型计算得到的主题向量聚类,把具有相似主题分布的区域分组,完成城市功能区域的划分。(3)将划分结果与卫星地图进行对比,通过人工标注的方式得出七种类型的功能区域,对不同功能区域的特点进行总结。进一步将MPETM框架推广到一般情况,城市计算或数据挖掘领域中的许多应用都涉及时间序列数据和其他数据融合的问题,在MPETM框架下,将城市计算中的轨迹数据或者数据挖掘中的时间序列数据通过词嵌入获得更丰富的语义特征和上下文特征以有效的提取数据中潜在的信息。同时,将研究问题转化为文档主题建模,利用概率主题模型融合多源数据,获得文档的主题分布,最后根据研究目的,对获得的主题分布进行二次处理或者总结分析。本论文在大规模数据集上进行实验,通过与词频聚类算法,狄利克雷多项式回归主题模型和基于深度学习的主题模型进行对比,MPETM框架具有更好的效果。