基于公共交通大数据的站点识别算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:cscbob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的急速发展,城市堵车现象日益严重,倡导公民采用公交出行,是缓解这个问题的最好方法。目前,乘客IC刷卡数据大量积累,通过IC刷卡数据研究乘客出行时的行为规律,可以为城市建设、公共交通系统发展提供有效信息。但是,公交IC刷卡数据中仅存储了乘客乘坐公交车时的刷卡时间等信息,数据严重残缺。针对这一问题,本文通过深入挖掘研究重庆市公民公交出行的行为习惯,对乘客上下车站点识别、线路站点客流特性展开深入研究。本文的主要工作内容如下:第一,针对基于换乘行为的上车站点识别算法存在的问题,本文通过分析挖掘乘客使用IC卡出行时的行为规律,对算法进行改进,提出基于乘客行为的上车站点识别算法。首先,针对公交换乘时两个公交线路存在多个相交站点所导致的乘客组的上车站点识别数量少的问题,本算法先通过地铁-公交换乘信息,识别部分乘客组的上车站点,并将刷卡记录和公交站点切分为多个子段,在各个子段中,根据时序关系筛选乘客公交换乘的候选上车站点,进而得到公交换乘乘客组的上车站点。其次,针对早高峰及早高峰之前时段中乘客换乘信息较少,无法有效识别乘客上车站点的问题,本文研究多个工作日中IC卡忠诚用户在该时段的乘车习惯,通过条件筛选,找到IC卡忠诚用户在该时段乘坐目标线路时的上车站点,进而识别其他乘客的上车站点。第二,针对基于概率的下车站点识别算法在计算站点吸引系数时存在的问题,本文以公交站点为研究对象,提出基于大数据的下车站点识别算法。在现有算法的基础上,本文从站点的客流分时段特征、多个工作日站点累计发生量这两个因素上,改进站点吸引系数的计算方法,得到更为客观稳定的站点吸引系数,计算公交线路各站点的客流量和客流特性。本文采用重庆市公共交通大数据,从站点识别准确率和平均相对误差方面对本文所提出的算法与改进前算法进行比较和分析,实验表明,本文提出的算法在识别上下车站点方面具有更好的性能。
其他文献
结合我国制糖工业生产中的实际情况,介绍了用于制糖业的各种消泡剂以及对消泡剂的一些要求.并对制糖业中的消泡机理进行了论述.
目的:对三七及三七叶所含皂苷类成分进行对比研究.方法:采用薄层色谱法和高效液相色谱法对二者所含皂苷类有效成分的类型进行了综合比较,采用高效液相色谱法对二者人参皂苷Rb
目的 探究耳蜗死区在感音神经性听力损失(sensorineural hearing loss,SNHL)患者中的存在情况及其对言语识别能力的影响。方法 采用纯音听阈测试筛选出41例(81耳)感音神经性听力
目的:观察和探索抗肿瘤血管生成药与化疗联合治疗胚胎性横纹肌肉瘤(ERS)的可行性和模式。方法:2例难治性ERS,采用重组人血管内皮细胞抑制素(恩度)和参一胶囊与常规化疗药物联合治疗,
墨子政治思想的核心是"尚同",这一思想以"兼爱"为理论基础,以"尚贤"为现实起点。"尚同"与"忠君"关系密切。"忠君"并非封建专制思想,中国国家发展所呈现的大一统趋势实际上得益于"尚同"思想,
对干燥机填料故障的主要原因进行了深入分析,指出了故障内在原因,干燥机密封填料的聚四氟乙烯盘根编织型式不合适,造成其磨损溃散污染物料,建议选用抗磨损溃散性更优异的穿心
当前信息化已延伸到社会各行各业,成为驱动社会发展的重要动力.作为妇幼保健机构,积极推进信息化建设,打造网络化、数字化医院,努力构建信息化服务网络,既是妇幼保健机构适应
鄂尔多斯盆地东部太原组在绥德地区发育一套潜在的烃源岩,总有机碳(Total Organic Carbon,TOC)含量为0.75%~5.71%(平均2.75%);镜质体反射率(Ro)为1.43%~2.12%(平均1.80%),处
[目的]探索有机肥在烤烟生产中的适宜用量,为烤烟生产上有机肥的推广使用提供依据。[方法]研究了施用不同量有机肥对烟株生长发育及产值量的影响。[结果]施用有机肥能提高烟叶
乒乓球是一项竞技类隔网运动,它速度快、旋转强,要求运动员在技术方面无明显漏洞并特长突出,因此运动员的基本技术选材显得尤为重要。本文以湖北省队、武汉市队、武汉市业余