论文部分内容阅读
近年来,随着卫星技术、全球定位技术、传感器网络以及电子移动设备等科技的不断进步,基于位置的应用在人们的生活中越来越普遍。实时交通路况监测系统,移动对象实时位置定位系统的应用也越来越广泛。随之而来的是蓬勃发展的基于位置的服务和移动社交网络的普及。移动对象随着时间的变化产生的实时位置信息不断积累,构成了该移动对象在一定时间内的一条运动轨迹。这些由各种不同的移动终端每日产生的巨大数量的轨迹数据,已经成为为不同类型的应用领域进行知识探索的源泉。这些海量轨迹数据中往往隐藏着非常重要的信息。然而,想从这些爆炸式增长的轨迹数据中准确迅速地发掘出对人类有用的信息也绝非易事。加之时空数据处理更为复杂,如何高效管理和利用这些轨迹数据,如何从中挖掘出对不同应用有价值的潜在信息,对当前该领域的研究者和使用者提出了巨大的挑战。在众多数据分析方法当中,聚类作为数据挖掘领域的一种非常重要的数据分析方法,越来越多地被研究人员应用到轨迹数据挖掘的过程当中。针对这一背景,本文主要围绕轨迹数据处理中轨迹划分、子轨迹问距离度量、子轨迹聚类以及移动对象轨迹簇在线实时更新等重要问题展开研究,在此基础上,提出了改进的子轨迹划分算法、新的轨迹距离度量方法和移动对象轨迹簇在线实时更新算法。考虑到移动对象轨迹数据包含新的属性维度,包括位置、时间、速率和方向等,相应的轨迹数据分析应采用新的方法。对于轨迹数据的处理问题,本文摒弃已有方法中所存在的缺陷,不把物体轨迹作为一个整体来处理,而是全面考虑时空数据的多维信息,首先把一条轨迹划分成若干子轨迹,并把子轨迹作为聚类的基本单元;对于子轨迹间距离的度量问题,本文提出了一种多维距离度量方法,综合考虑了时空数据的时间、空间及速率等多维属性,该方法能够根据不同的应用场景更加真实有效地度量不同子轨迹之间的相似程度,从而提高轨迹数据处理的准确性;对于移动对象轨迹簇在线实时更新问题,本文提出了一个新的轨迹簇存储结构实时更新算法,该结构记录了移动对象最新的子轨迹聚类结果,实现了实时在线更新,为轨迹数据的实时应用提供了便利。本文通过在真实出租车GPS轨迹数据上的实验,证明了本文所提出的新的轨迹数据处理方法较之相关算法具有更好的处理效率和聚类效果。这些研究成果具有重要的学术价值和广泛的应用前景。