论文部分内容阅读
近年来,伴随着感知技术和移动互联网的成熟,交通流数据、气象数据、道路网和兴趣点数据、移动轨迹数据、社交媒体等数据在城市里悄然而生,这些异构大数据为智慧城市的建设提供了数据基础。同时,现代计算机计算能力的极大提高与并行计算的成熟,使得通过挖掘和分析这些海量数据来解决城市发展中因人口数量攀升而带来的各种问题成为可能。在这背景下城市计算的概念应运而生,城市区域功能描述和人群流动分析作为城市计算中的两个热门应用,本文以新浪微博用户签到数据为数据源对它们展开研究。描述城市区域功能作为城市研究和规划领域中长期存在的问题之一。本文从城市建筑的角度出发,基于签到数据提取了建筑的时间序列数据,依据具有相似功能的建筑物拥有相似的时空特性的特点,提出了时间序列匹配(Matching Time Series,MTS)算法来判别建筑时空特性的相似度,并以该算法配合最小二乘孪生支持向量机(Least Squares Twin Support Vector Machine,LSTSVM),通过划分工作日和周末这两个时间段分别建立多分类模型来达到精准识别城市建筑功能的目的。然后以该模型为基础,结合自适应DBCSAN聚类算法和泰森多边形法提出一套新颖的描述城市区域功能分布的流程。经与研究区域的实际情况对比,本文提出的方法在识别城市建筑功能上具有较高的准确率,而且利用不同时段的数据可以动态清晰地描述城市区域的功能分布状况。针对城市人群流动的分析研究,本文首先从用户角度出发,基于从签到数据中获取的用户活动数据,结合自适应DBSCAN和K-medoids混合聚类算法,马尔可夫链模型和活动类型检测方法,提出了一个预测用户下一个移动位置的数学模型。该模型的优点是可以减少预测空间范围并进一步提高预测下一个位置的准确性。通过相关的实验验证,我们不仅可以获得较高的活动类别预测精度,而且可以方便地预测用户的下一个到达位置,达到分析用户移动趋势的目的。然后本文又通过用户移动轨迹到城市区域的映射,利用OriginDestination(OD)分析对城市区域间的人群流动进行了可视化研究,并基于图论中的有向图,度中心性等理论,建立了区域间人群流动模型,对城市各区域的重要程度进行了量化评估。研究结果可以有效地帮助城市决策者理解城市与分配资源。