论文部分内容阅读
城市的“大型化”对城市管理者提出了更高的要求,城市规划、交通、节能、环保等均要求以实时可靠的数据作为科学决策的依据。本课题基于移动网络通信日志、智能交通系统的多源异构数据(智能交通卡刷卡日志、出租车GPS轨迹记录以及传感器数据等)联合社交网络签到与评论数据,对城市范围内人类移动行为以及区域功能属性进行了统计分析和理论建模。本文主要采用“动”、“静”结合的挖掘方法,基于统计学、机器学习、模式识别、自然语言处理等方法,对城市时空模式进行挖掘和分析,主要包括四个部分:首先,从宏观尺度对群体和区域两个角度对城市时空行为进行统计分析,针对群体的分析采用空间点模式分析、时序分析方法,研究了群体的聚集模式、移动模式,针对区域的分析采用网格方法,研究了热点区域的分布特点、人流的更迭速率、潮汐效应,并提出了区域差异指数的概念用于研究区域间的时空相关性。此后,深入研究了群体驻留模式和交通流量模式两种时空模式。针对群体驻留模式,首先提取出驻留轨迹段,针对轨迹存在稀疏、缺失等特点,结合用户固有模式、区域固有模式、全局模式,采用加权最小二乘法对驻留轨迹段起止时刻进行估计,有效提升了估计的准确性,之后建立层级贝叶斯模型对群体时空行为进行聚类,采用最大期望算法和马尔科夫蒙特卡洛算法相结合的方法进行求解,能够有效挖掘出城市群体驻留模式,在模型评价指标上具有一定优势。针对交通流量模式,分别基于地铁、出租车两种不同交通方式采用张量分解的方法,对流量在时、空维度上进行模式分解,对比了不同交通方式在时、空模式上的差异,并结合兴趣点分布,提出了一种基于深度神经元网络的流量重构算法,能够针对没有历史流量信息的新建城区或历经改造的老城区进行时变流量重构,并达到较高的交通量重构准确率。最后,基于社交签到与评论数据,提出了一种主题模型算法,该主题模型能够对全局主题和局部主题进行区分,并有效过滤掉噪音数据,挖掘出区域的语义属性,有助于对模式进行理解。