论文部分内容阅读
公共交通工具作为一种经济、快捷的交通方式,不断吸引着大量城市居民进行交通出行。而无处不在的社会关系纽带又促使着乘客采用公共交通工具共同出行,以完成以通勤、节假返乡、商业洽谈、休闲娱乐,甚至扒窃犯罪为目的的多类型关联出行活动。度量公共交通场所内不同类型乘客在时间、空间、属性维度的关系近邻性可为智能识别多类型关联出行模式,从而为可视化分析他们的移动关联模式提供依据。研究围绕着公共交通场所乘客移动关联模式挖掘这个课题,在完成对公共交通大数据的清洗、缺失关键字段填充、出行链构建的基础上,宏观探索了海量乘客在长时跨度下活动空间的宏观时变模式;并基于异常个体出行行为在时间、空间、移动属性上的关联特性,提出了一套自动检测公共交通场所内异常团体移动关联模式的挖掘方法;考虑到上述移动关联性也存在于其他类型乘客中,提出了一个更加通用的基于出行行为相似性、交互性和社区驱动性的乘客移动关联模式挖掘方法;最后,设计并实现了一套公共交通场所内乘客移动关联模式可视化分析系统,支持用户直观、交互、高效地探索目标乘客的移动模式、关联特性及其出行特征。主要研究内容如下:第一、基于公共交通大数据的乘客活动空间宏观时变模式挖掘。研究采集了北京区域长时跨度的公共交通大数据,探索了海量乘客活动空间的宏观时变模式。首先根据乘客出行是否规律划为2类,并从空间覆盖、距离覆盖和频率覆盖维度量化活动空间的渐变特征和扩张特征,对比分析这些特征在时间渐变和扩张场景下的变化特性及关联关系。研究结果表明:这2类乘客的活动空间特征呈现截然不同的日变、周变和月变特性,为公共交通场所内特征化异常出行行为、检测异常团体奠定基础。第二、基于监督学习的公共交通异常团体移动关联模式挖掘。针对目前依赖大量人力检测公共交通场所内异常事件的现状,提出一套自动检测异常团体移动关联模式的挖掘方法。基于乘客出行行为在时间、空间和属性上的分布特征,嵌入先验异常类型对全体数据进行组别细分和聚类,并采用多算子分级标定的方式,自动构建一个异常个体样本库,完成对异常个体的监督学习。同时,异常个体所形成的关联网络类比为一张图。图中的节点代表离散的异常个体,而边权值代表异常个体在时间、空间、移动模式上的加权相似性。采用基于模块度最优的社区发现方法来识别异常团体。最后以微博数据中报导的公交扒窃事件为例,验证所提方法的性能。第三、基于联合概率加权模型的公共交通乘客移动关联模式挖掘。在上述对特定团体移动关联模式的基础上,提出一种更加通用的乘客移动关联性分析模型。这个模型不仅度量了乘客在出行行为相似性和交互性的原生关联强度,基于社区关系延伸的邻里关联强度,以检测任意类型的乘客之间的移动关联模式。所提模型对一个含4,162对关联个体样本库的分类结果证实了它在平均分类精度上比现有方法提高7.50%。第四、基于公共交通大数据的乘客移动关联模式可视化分析系统研发。在上述研究的基础上,设计并实现一套直观的、交互的、高效的乘客移动模式可视化分析系统,来智能检测公共交通场所内的目标个体及团体。研究从自动整合的碎片式出行线索中提取备选乘客,并采用“宏观—微观”的可视化框架探索他们的宏观和微观移动关联特性,从而对潜在目标乘客及其团体出行模式进行可视化和特征化。3个实际案例和30位用户性能评估实验证实了所提系统在目标检测、目标追踪、目标特征化方面的功效。总而言之,研究以丰富的实践案例展示了如何在交通领域有效地使用公共交通大数据。研究成果有利于加强交通大数据在交通安全管理方面的深层应用;可为满足多类型乘客的出行需求提供依据;也可为安保部门识别公共交通场所内的特定犯罪团体或失踪人群提供支持。