论文部分内容阅读
近年来,随着物联网技术和移动对象数据库技术的迅猛发展,各类传感器设备收集到了大量的移动对象数据。移动对象领域的研究成果被广泛运用于诸如移动社交应用中的签到、交通物流管理、生物迁徙等研究和军事入侵检测等多方面。很多大型公司已经开始推出移动环境下的各类有实际意义的应用,如基于用户位置信息的商品和酒店推荐,它会根据用户的特点给出最适合其需要的相关信息。由于传感器设备每天会生成TB级别的移动对象数据,对移动对象研究的主要困难在于如何处理这些海量的移动对象数据。最近,研究人员开始关注于从大量的移动对象数据中挖掘出频繁路径模式,其中发现一起运动的移动对象组就是一个较热门的问题。使用传统的方法很难高效地发现一起运动的移动对象组模型,这些方法要么忽略了时间维度的信息,要么在时间和空间上的消耗过大,而且挖掘结果并不能满足实际需求。本文在研究国内外现有方法的基础上,主要针对移动对象轨迹时间特征点的提取、旅行同伴的发现和预测移动对象下一步的位置信息等问题进行了深入的研究。本文的主要内容和创新点如下所述:1)针对移动对象数据量大,数据抽样点不易确定的问题,本文引进信息熵和信息增益的概念,通过计算每个时间点的信息增益,把具有最大信息增益的结点作为时间特征点提取出来,通过这一方法我们可以大大节省相关的时间消耗和空间消耗,将能代表运动趋势的关键结点报告给系统,从而便于我们后续发现旅行同伴时的抽样时间点选取提供依据。2)为了从移动对象产生的RFID数据中发现旅行同伴这类模型。本文在引入聚类相交算法(CI)的基础上,提出了一种封闭聚类相交算法(CCI)来发现一起运动的旅行同伴,它主要由两个步骤构成:首先对RFID轨迹数据流产生的子轨迹进行聚类,产生子轨迹簇;再将其与同伴候选集相交从而改进候选集,找出满足条件的候选项作为旅行同伴。在这一过程中,我们使用封闭性的原理来减少发现旅行同伴过程中的时间消耗,加速我们处理的过程。实验表明该方法可以快速和有效的发现相关的旅行同伴,从而说明了我们这个算法是合适的。3)我们针对移动对象的运动特点,提出了基于时空后缀树模型的位置预测方法。首先我们根据历史轨迹数据,去发现相关的频繁区域,然后对轨迹进行转换,从而建立一棵时空后缀树模型(STS-tree),再根据最近轨迹序列顺序和需要查询的时间对移动对象未来某个时间下的位置信息进行相关的预测。这样我们就可以根据相关的预测结果,进一步判断移动对象下一步运动趋势,为实际运用中的分析和决策打好基础。实验表明,在频繁区域发现问题上,通过基于网格的聚类比基于密度的聚类要合理和高效的多。在位置预测结果上,STS-tree也比传统的混合预测方法要好。