移动对象轨迹序列模式挖掘

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:a369747001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球定位系统(Global Positioning System,简称GPS)越来越普遍地运用,考虑到对移动对象(Moving Object)进行定位跟踪,通过GPS获取到移动对象的活动轨迹,并对轨迹序列进行分析研究具有潜在的重大价值。序列模式挖掘(Sequence Pattern Mining)作为数据挖掘的一种重要方法,备受关注。本文实验采用的数据集来自2008年五月的美国旧金山出租车移动数据,主要分布在旧金山湾地区,共包含536辆出租车的GPS坐标数据。(1)作为包含时间和空间两个方面的移动轨迹信息,GPS采集的数据具有数据量大、周期性、噪声干扰严重、缺失性等特点,如何对轨迹数据进行有效地预处理并得到有用的数据,将会直接影响到序列模式挖掘与匹配预测的正确性。本文从数据插值、数据聚类、数据归一化、数据特征表示以及灰色关联分析等方面对数据进行处理,并通过对GPS轨迹停留点的检测与合并方法对轨迹点进行优化,使数据能够高效的进行特征提取,为后续算法提高可靠的轨迹序列。(2)面对基于Apriori算法基本思想的AprioriAll算法、GSP算法以及SPADE算法等以及基于模式增长的算法,包括Freespan算法、Prefixspan算法等,通过对几种算法进行对比分析,本文吸取了模式增长方式不产生候选序列的优点,同时通过对候选序列更加有效地剪枝进行算法优化,有效地提高了模式挖掘算法的效率以及正确性。(3)面对序列模式匹配不准确这一难题,本文提出了FreSeqMatching匹配算法,利用提出的序列类、序列焦点的定义,结合相似度分析的概念,通过对匹配效果及时反馈以及支持度等条件进行及时调整,结合模式挖掘算法,有效地提高了序列模式匹配的精度以及移动对象轨迹预测的准确率。
其他文献
Web Service是一种不依赖于编程语言、计算平台和网络协议的开发标准,它可以通过高级的编程抽象,为应用开发者屏蔽分布复杂性。负载均衡的主要功能是合理透明地在服务器之间
随着近代社会的飞速发展,全球范围内各种金融风暴、危机不断。这种现象引起了各国政府和经济学家对金融风险问题的普遍关注。为此经济学家提出了各种预警模型,然而这些模型都
Ad-Hoc网又称多跳网或自组织网,由于Ad-Hoc网络没有绝对的控制中心、动态拓扑结构变化及节点资源受限等缺点,Ad-Hoc网络的安全问题已成为当前的研究热点。签密能同时完成数字签
网格计算自从上一世纪九十年代中期出现以来,逐渐被认为是支持广域并行和分布式计算的下一代主流计算平台,可以实现计算、信息、数据、存储、知识等资源的全面共享。网格工作
近年来,随着CAD/CAM技术在企业的应用日益广泛,企业已具备了先进的产品设计与开发手段,工作效率得到显著提高。与此同时,企业积累了大量的图纸、文档等技术资料,且这些电子化
车辆识别技术是智能交通领域的关键技术之一,车标识别技术是车辆识别技术新的研究方向,是对基于车牌和车型识别的车辆识别技术的重要补充和发展,具有十分重要的理论意义和应
自从20世纪80年代以来,群体智能(Swarm Intelligence)作为一个新兴领域,引起了许多研究人员的关注,已经成为人工智能以及社会、经济、生物等交叉学科的热点和前沿领域。人工神经
随着信息量的增长,数据挖掘技术在越来越多的领域广泛应用。数据挖掘是通过对大量数据进行处理,析取、识别和发现可用知识的过程,从而帮助用户了解已有的信息,并预测未来的信息。
随着云时代的来临,大数据(Big data)也吸引了越来越多行业以及学术界的关注。近些年中,数据以指数级的速度增长,为了保证数据中心的对外提供服务的质量,实现更好的分布式文件