基于T-OPTICS的个体出行轨迹聚类方法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:pk8984812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通讯技术与网络技术的飞速发展,出行轨迹数据的获取成为可能,其形式也变得更加多样化,而针对个体出行轨迹的研究近年来也成为一个热门领域。我们可以从个体出行轨迹中获取时空信息,并通过和地表信息相结合,推断出轨迹的出行信息,因此在个体出行轨迹数据集中,我们可以挖掘到许多有用的知识和模式,并将其应用于城市规划、交通管理等多个领域中。  近年来针对个体出行轨迹的研究也越来越多,其研究方法主要集中在三个方面:基于单一属性的统计学方法、基于时间地理学的分析方法以及基于时空轨迹聚类的数据挖掘方法。几种方法均能够从个体出行轨迹数据中获取许多知识,并根据研究目的的不同进行不同的分析与应用,但这些方法都存在一定的局限性,我们需要寻找一种适当的方法,自动识别复杂轨迹数据集中存在的模式,有效识别噪声,同时能够提供一种可视化的手段,使聚类结果易于分析。  在本文中,我们定义了两种新的轨迹间相似性度量,即离散化距离和时空Fréchet距离,并分别应用这两种距离提出了基于T-OPTICS的个体出行轨迹聚类方法。方法主要包括以下四个步骤:即轨迹间距离的计算、使用T-OPTICS方法进行轨迹的可达距离排序、通过阂值的设定确定最优算法参数以及聚类结果的可视化。针对方法的特点,本文分别采用栅格图和中位数图的形式直观的展现聚类结果。  在方法的验证上,本文通过模拟数据对方法的可用性与准确性进行了验证,并通过对北京市居民出行活动数据进行聚类分析,得出了远、中、近距离的白天出行、全天在家、短时间出行、多次外出、外出未归等多种出行模式,并对工作日与非工作日的出行模式进行了分析比较。我们进一步将方法的聚类结果与其他相关方法和一项相关研究的结果进行对比,证明了方法能够自动识别模式和噪声、聚类结果更为细致的优点。  本文的主要创新点包括:1、提出了新的轨迹间相似性度量:即离散化距离和时空Fréchet距离,并给出了具体的距离计算方法,为描述个体出行轨迹的模式提供了思路;2、分别针对距离定义的特点,给出了评价聚类结果的阈值,即最大聚类直径和Fréchet距离的时间阈值,并通过该阈值的设定,为选择聚类参数提供依据;3、提出了将聚类结果进行可视化的方法,将不同的轨迹聚类结果用对应的形式表现,直观的反映每个聚类代表的出行模式。
其他文献
本文针对双河煤矿周边小煤窑威胁安全、深部开采安全管理难、资金紧安全投入少和用工复杂职工素质差的实际,提出并论述了新形势下实现该矿安全生产的“三个约束机制”和“三个
东亚飞蝗是引发我国蝗灾的最常见蝗虫。我国史籍中记载的800多次蝗灾,主要是指东亚飞蝗所引起的蝗灾。近年来,由于气候变化和人类活动等原因,这类蝗灾在我国有不断加重之趋势
影响煤矿安全的人为因素很多,主要表现在职工的素质低下、管理不善、有法不依三个方面,我们要从加强领导、强化教育、建立现代企业制度,搞好综合治理几个方面入手,切实加强和改进
随着社会发展,科学技术的不断进步,市政公路桥梁施工也就越来越多,进而针对于市政公路桥梁的施工安全技术方案的探析就显得尤为重要了。本文就是针对市政公路桥梁的安全施工的必
第二炮兵某旅司令部机要参谋孟祥斌舍己救人的惊人一跃,感动了驻地一座城市,成为浙江省2007年最具影响人物;进而又以1300多万张选票当选中央电视台“感动中国2007年度人物”
水资源是干旱区社会生活和经济生产中最基础和最不可缺少的资源,开展社会经济系统水循环研究,认识经济系统内部不同产业之间水资源的迁移及转化特征,能够为张掖市水资源管理
随着GIS的应用范围在广度和深度上不断增加,城市三维空间数据建模成为GIS研究的热点问题。 针对现有的城市三维软件大多是面向视觉上的景观制作与浏览、三维模型采用文件
资源型城市是因自然资源的开采而兴起或发展壮大,且资源型产业在工业中占有较大份额的城市,在社会主义市场经济体制下,资源型城市大多面临着诸多经济与社会问题。产业转型是资源
越来越多的研究者关注尺度效应在其研究领域的重要性。大量研究证实,地理学研究对象格局与过程及其时空特征均是尺度依存的,也就是说,这些对象表现出来的特质是具有时间和空间抑
"地面沉降GIS建模及模拟研究"是GIS建模技术在地学模拟研究领域的具体体现,论文针对地面沉降模拟模型属于分布式机理过程模型特点,在前人研究成果的基础上,深入研究基于GIS构