论文部分内容阅读
刷卡数据为研究公共交通乘客长期出行规律提供了数据基础.利用北京市2018年4~5月的刷卡数据,通过提取乘客活动地,推断居住地位置和识别活动类型3个步骤构建乘客个体活动链;基于PrefixSpan算法提取普通卡、老年卡、学生卡乘客活动链的频繁序列模式,采用Levenshtein距离度量3类乘客活动链日维度的相似性.结果表明:每类用户中约70%乘客的频繁活动序列是对称模式;普通卡和学生卡用户的相似性高于老年卡用户,平均值分别为0.645、0.649和0.530;3类乘客的工作日与非工作日活动链具有明显差异,而