论文部分内容阅读
当今时代,信息化特征明显,人们观察物理世界所获得的数据均用计算机信息表示。为了更好的观察和分析人们生活的物理世界,人们采用了多种多样的信息数据收集方法。而如何能够将这些数据融合,如何检索到相似的数据已成为研究的热点。本文主要分成两大部分,第一部分是讲述如何采用函数连接算法解决传统方法解决不了的目标轨迹数据与属性值数据的关联问题;第二部分是讲述如何在给定的目标轨迹下,查询相似的轨迹数据。在面向轨迹数据的函数连接算法中,本文先给出了目标轨迹数据和属性值数据的数据模型的定义,这些定义反映了关系数据库中的数据的存在方式。继而本文给出了循环函数连接算法,这种算法使用循环的方法,对任意一条轨迹和属性值数据进行判断,看是否满足连接条件。在这里判断的条件采用的是函数的方法,本文利用轨迹数据和属性值数据作为函数的输入条件,函数通过数据是否存在相近的时间空间关系和属性值数据是否满足属性值限制条件来判断是否满足条件。当满足条件时,连接成功。之后本文提出了一种基于哈希的算法来改进原有的循环连接算法。基于哈希的函数连接算法能够有效的解决循环算法的缺点,即不能在大规模的数据下使用。在这两种算法基础上,我们又给出了一种优化的策略,这种优化是将目标轨迹的数据进行压缩,从而减少连接操作的运算量。对于这种优化策略,我们给出了相应的理论分析,并给出了误差率。在面向轨迹数据的相似性查询算法中,本文先给出了新颖的目标轨迹的距离函数度量的方法。这种方法有效的解决了目标轨迹之间相似度的计算,并为后文提出的算法奠定了基础。接下来本文给出了相似性的定义和判断,在本文当中,我们采用欧式空间的距离函数来判断是否两个目标轨迹数据相似。之后本文给出了一种判断相似性的算法,即利用给定的轨迹数据,截取轨迹的子串并和数据库中的轨迹数据做相似性判断的算法。通过这种算法我们能够查询相似的轨迹数据。最后我们给出了面向轨迹数据的相似性查询算法的改进策略,给出了改进算法的召回率,并同时给出了对比实验。