大规模轨迹数据的检索、挖掘及应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:luming123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
轨迹可以看作是移动对象随着时间的变化在空间中留下的印迹。近年来,随着民用GPS(全球定位系统,Global Positioning System)等定位设备在移动终端上的广泛使用以及基于位置服务(Location-Based Service)和移动社交网络(Mobile Social Network)的发展和普及,大量的轨迹数据在日常生活中正在日益积累并为不同类型的应用所服务。   这些与轨迹相关的新兴技术和服务为人们的生活带来方便的同时,也对海量轨迹数据的管理和利用提出了极大的挑战。如何高效的检索轨迹数据,如何从轨迹数据中挖掘出对不同的应用有价值的潜在信息,已经成为时空数据管理和挖掘领域的一个重要研究课题。本文围绕轨迹数据的检索和挖掘,针对移动对象和轨迹的κ近邻检索、轨迹数据的映射和地图匹配、轨迹数据挖掘及其在智能交通中的应用等若干重要问题展开研究,并结合实际应用,给出了具体的解决方案和实际系统,这些研究成果具有重要的学术价值和广泛的应用前景。具体而言,本文的主要研究成果、贡献和创新点可概括为以下几点:   1)提出了一种路网中移动对象连续κ近邻检索的高效近似算法。传统的基于欧氏距离的κ近邻算法不能适用于基于路网距离的移动对象的κ近邻检索,现有的路网中移动对象的κ近邻检索由于其计算代价巨大,很难适用于在线连续检索。本文提出的方法通过从路网中提取特征集,利用离线计算与在线计算相结合的方式,实现了高效的连续κ近邻的实时检索。此外,本文针对算法复杂度和近似精度给出了理论分析和证明。   2)提出了κ近邻轨迹检索的概念,并将κ近邻轨迹检索问题转化为聚合top-κ查询问题。本文提出了在无随机访问情形下,top-κ聚合查询的高效算法,本文针对实例最优性和访问时间进行了理论分析和优化,并在生成数据集和大量真实数据集上验证了该算法的高效性和有效性。   3)提出了针对轨迹数据挖掘预处理的若干算法。针对轨迹数据在路网中的映射,本文提出了一个基于图像处理中形态学方法的地图分割算法,巧妙的解决了基于栅格的路网分割问题;针对路网中的低采样率轨迹,本文提出了一种基于相互投票的地图匹配算法,该算法比现有最好的低采样率轨迹算法提高了10%的匹配准确率;针对地图匹配中的错误匹配结果,本文提出了一种多项式时间的平滑算法,解决了因错误匹配导致的路径迂回问题。   4)提出并实现了一个基于出租车轨迹的智能行车路线规划系统(T-Drive系统)。该系统从大量的出租车GPS轨迹中挖掘有经验的司机在路线规划中的智能,同时结合实时交通状况数据进行分析和预测,从而为普通的驾车用户提供个性化的实际通行中的最快路线。本文在该系统中提出了一系列轨迹数据挖掘的模型和方法(如地标图模型、方差一熵聚类算法、基于高阶马尔科夫的交通预测模型),并以大量的实验比较了该系统和现有的路线规划系统及算法,实验结果充分验证了该系统的有效性以及相对其他方法的优越性。   5)提出并实现了一个基于出租车轨迹的推荐系统(T-Finder系统)。该系统给出租车司机推荐最易等到乘客的地点以及去往这些地点的路径,并同时给乘客提供附近最易打车的地点。本文从实际轨迹数据中挖掘出收益最大的司机,并通过研究他们的数据挖掘他们的行为模式。本文在该系统中提出了停泊点检测和聚类等算法从轨迹中找出收益较高的司机经常等待乘客的地点,并利用概率模型分析了司机和乘客在选择不同策略时的成本及风险。本文利用实际数据和实地测试相结合的方式,验证了该系统的有效性和可靠性。
其他文献
时间序列是一种广泛存在的数据,客观记录了所观测的系统在各个时刻点的具体值,所以可以通过研究时间序列数据来辨识和重构所观测系统的动力学行为。早期的研究方法是基于统计
随着我国证券市场的不断发展和完善,股票市场作为我国经济“晴雨表”的功能也越来越突出,无论是个人投资者还是国家都十分关注股票市场的走势。若能较为准确的预测股票市场的涨跌趋势,不仅可以为广大投资者提供投资决策的依据,也能够为国家制定相关经济政策提供参考。股票市场具有非线性、高噪声、数据量大等特征,相关的股票分析方法,如基本面分析法、技术面分析法、时间序列分析法等,各有特色,但难以适应日趋复杂的股市。研
随着互联网的迅猛发展以及电子商务的快速流行,海量信息充斥在人们的生活中。信息超载问题也越来越严重。为了解决该问题,推荐系统就此诞生。它通过分析用户的历史行为记录,得出
MQX是一款主要面向工业控制、汽车电子及消费电子等领域实时多任务应用的嵌入式实时操作系统。2009年,飞思卡尔公司半导体公司开始免费开放MQX3.0.1版源代码,同年,苏州大学飞思
随着Web技术的不断发展进步,J2EE已成为Web开发的应用技术的最流行的架构规范。这个平台已经拥有很好的技术支持和服务,它的多层架构受到大型Web开发者的青睐,是解决企业应用
随着人们出行需求的大幅增加和各类交通工具数量的迅速增长,对轨迹数据进行分析和挖掘开始受到广泛的关注和重视。得益于智能交通系统在各大城市的普及应用,大量的车辆轨迹数
随着大数据时代的到来,数据开始呈爆炸式的增长,互联网用户越来越被淹没在数据的海洋之中。因此,如何帮助用户从海量的信息中找到真正感兴趣的资源成为一个亟待解决的问题。商品
自然语言中的实体是指语句中出现的客观世界中存在的,并可相互区别的对象或概念。推断实体所属的语义类型是自然语言处理中的一项有着重要意义的任务,也是一项很有挑战性的任务
随着智能手机等移动终端的兴起,移动互联网正在慢慢地改变人们的生活和习惯。基于位置服务(LBS)的应用作为移动互联网的一个重要组成部分,是每一个移动终端上必备的应用程序。
云计算作为一种新的信息技术,为海量数据的分析和处理带来了全新的视野。它是一种商业计算模型,将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算能力、存