面向轨迹数据的函数连接及相似性查询算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:luye063006300630
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,信息化特征明显,人们观察物理世界所获得的数据均用计算机信息表示。为了更好的观察和分析人们生活的物理世界,人们采用了多种多样的信息数据收集方法。而如何能够将这些数据融合,如何检索到相似的数据已成为研究的热点。本文主要分成两大部分,第一部分是讲述如何采用函数连接算法解决传统方法解决不了的目标轨迹数据与属性值数据的关联问题;第二部分是讲述如何在给定的目标轨迹下,查询相似的轨迹数据。在面向轨迹数据的函数连接算法中,本文先给出了目标轨迹数据和属性值数据的数据模型的定义,这些定义反映了关系数据库中的数据的存在方式。继而本文给出了循环函数连接算法,这种算法使用循环的方法,对任意一条轨迹和属性值数据进行判断,看是否满足连接条件。在这里判断的条件采用的是函数的方法,本文利用轨迹数据和属性值数据作为函数的输入条件,函数通过数据是否存在相近的时间空间关系和属性值数据是否满足属性值限制条件来判断是否满足条件。当满足条件时,连接成功。之后本文提出了一种基于哈希的算法来改进原有的循环连接算法。基于哈希的函数连接算法能够有效的解决循环算法的缺点,即不能在大规模的数据下使用。在这两种算法基础上,我们又给出了一种优化的策略,这种优化是将目标轨迹的数据进行压缩,从而减少连接操作的运算量。对于这种优化策略,我们给出了相应的理论分析,并给出了误差率。在面向轨迹数据的相似性查询算法中,本文先给出了新颖的目标轨迹的距离函数度量的方法。这种方法有效的解决了目标轨迹之间相似度的计算,并为后文提出的算法奠定了基础。接下来本文给出了相似性的定义和判断,在本文当中,我们采用欧式空间的距离函数来判断是否两个目标轨迹数据相似。之后本文给出了一种判断相似性的算法,即利用给定的轨迹数据,截取轨迹的子串并和数据库中的轨迹数据做相似性判断的算法。通过这种算法我们能够查询相似的轨迹数据。最后我们给出了面向轨迹数据的相似性查询算法的改进策略,给出了改进算法的召回率,并同时给出了对比实验。
其他文献
随着网络技术和网络服务的飞速发展,XML(eXtensibleMarkupLanguage)越来越多地活跃在数据交换和存储领域。大量XML数据的出现,要求数据库具有更有效的XML数据管理能力和更快、
随着多媒体技术和计算机网络的飞速发展,全世界数字图像的数量正以惊人的速度增长。这些数字图像中包含了大量有用的信息,要利用这些信息就要求有一种能够快速而且准确地查找和
思想政治工作是我党我军的优良传统和优势,是部队正规化建设中的一项基础性工程。新兵思想政治工作是最基础、最常见的工作。但新上任的基层干部由于情况不熟,经验不足,措施办法
随着市场经济的深入发展,竞争手段日趋多样化,特别是赊销的发展,在扩大销售业绩的同时,也使许多企业饱受信用风险的困扰。针对企业赊销管理现状,在建立行之有效的信用管理制度和科
随着计算机技术的快速发展,特别是对远程办公、远程协作、远程维护和远程教学的需要,远程控制技术越来越引起人们的关注。远程控制是指从本机通过软件操作远程计算机的屏幕、键
在地理信息系统中,栅格数据是一种基本的空间数据模型。本文的主要研究工作是从实际需求出发,对栅格数据的生成、存储及可视化技术进行研究和探讨。 栅格数据的生成过程需要
机器学习是人工智能领域中重要的研究课题,是用计算机模拟人类学习活动的一门科学。机器学习用计算机模拟和实现人类的学习过程,目的是获取知识,有归纳学习算法、神经网络、遗传
公钥基础设施(Public Key Infrastructure)PKI技术已成为信息安全技术的核心,公钥基础设施和认证机构(PKI/Certification Authorities)PKI/CA安全体系能够有效解决电子商务、电
飞行模拟器操纵系统是向飞行员提供了操纵力的操纵负荷仿真系统。操纵系统的硬件和软件接口是飞行模拟器系统的重要组成部分,其性能的好坏直接影响到整个飞行模拟仿真系统的性
入侵检测是信息安全体系结构中的重要一环,其本质是一个对网络数据包、审计日志等大量数据进行数据处理的过程,如何从包含大量冗余信息的数据中自动、准确地提取出具有代表性的