论文部分内容阅读
随着交通系统的不断发展,人们对交通模型的关注逐渐从基于出行的研究转向为基于活动的研究,而相应的数据采集和分析过程也随之不断演变。近年来,随着大数据的发展,越来越多的长时大范围出行者时空轨迹数据能够被获取并加以利用,为基于活动的交通模型提供了良好支持。手机信令数据作为其中的一种典型数据,具有许多传统数据难以比拟的优势,但也面临着诸如语义信息不足、用户隐私限制等带来的数据缺陷,因此需要与传统数据如居民出行调查数据进行融合,才能进行出行活动行为分析。
论文首先利用2009年上海市居民出行调查数据及同一年份的美国五个大都市统计区的居民出行调查数据,经过预处理后得到各地区工作日和双休日的居民活动链。再以半小时为单位,根据活动链确定每个时段的主要活动类型,得到带时间段序号的活动类型序列。将一位居民的活动序列类比为自然语言处理中的一篇文档,序列中的一个元素视为文档中的一个词语,利用隐含狄利克雷分布(Latent Dirichlet Allocation, LDA)主题模型,获取居民的活动主题分布,并将其定义为居民的活动模式。用居民的活动主题分布对居民进行聚类,根据聚类结果把居民划分到不同的代表性活动模式之中,同时可实现个体分类的目的。并对中美六个地区工作日和双休日的代表性活动模式进行比较分析。
其次,论文对上海市的手机信令数据和居民出行调查数据进行融合,得到手机用户的活动链,利用前述方法识别出手机用户的代表性活动模式。论文还对循环神经网络(Recurrent Neural Network, RNN)进行改造,引入时间窗口和活动开始时间间隔转移矩阵、活动类型转移矩阵,构建了个体用户活动预测模型。对每个代表性活动模式进行训练,得到各自的模型参数,预测用户在下一个具体时刻的活动类型,并对预测结果进行评价。
本文为代表性活动模式识别提供了一种新的方法,根据代表性活动模式识别的结果进行个体分类,可以精准定位目标群体并进行决策分析。在非集计层面上,活动预测的结果可为基于活动的微观交通仿真提供支持,也能在用户个性化服务及实时服务中起到辅助作用。在集计层面上,若进一步考虑用户空间位置信息,可对用户日常活动时空位置进行预测,以区域为单位集计后得到区域的出行需求。
论文首先利用2009年上海市居民出行调查数据及同一年份的美国五个大都市统计区的居民出行调查数据,经过预处理后得到各地区工作日和双休日的居民活动链。再以半小时为单位,根据活动链确定每个时段的主要活动类型,得到带时间段序号的活动类型序列。将一位居民的活动序列类比为自然语言处理中的一篇文档,序列中的一个元素视为文档中的一个词语,利用隐含狄利克雷分布(Latent Dirichlet Allocation, LDA)主题模型,获取居民的活动主题分布,并将其定义为居民的活动模式。用居民的活动主题分布对居民进行聚类,根据聚类结果把居民划分到不同的代表性活动模式之中,同时可实现个体分类的目的。并对中美六个地区工作日和双休日的代表性活动模式进行比较分析。
其次,论文对上海市的手机信令数据和居民出行调查数据进行融合,得到手机用户的活动链,利用前述方法识别出手机用户的代表性活动模式。论文还对循环神经网络(Recurrent Neural Network, RNN)进行改造,引入时间窗口和活动开始时间间隔转移矩阵、活动类型转移矩阵,构建了个体用户活动预测模型。对每个代表性活动模式进行训练,得到各自的模型参数,预测用户在下一个具体时刻的活动类型,并对预测结果进行评价。
本文为代表性活动模式识别提供了一种新的方法,根据代表性活动模式识别的结果进行个体分类,可以精准定位目标群体并进行决策分析。在非集计层面上,活动预测的结果可为基于活动的微观交通仿真提供支持,也能在用户个性化服务及实时服务中起到辅助作用。在集计层面上,若进一步考虑用户空间位置信息,可对用户日常活动时空位置进行预测,以区域为单位集计后得到区域的出行需求。