云计算环境下时空轨迹频繁模式挖掘研究

被引量 : 3次 | 上传用户:yang97yang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展,GPS以及带有定位功能的移动终端应用到各个领域中,此外,移动互联网的迅速崛起进一步推动了基于位置服务的发展,使得大量的时空轨迹数据不断产生。对海量的时空轨迹数据进行模式挖掘对于理解移动对象的运动模式具有重要意义。每天产生的海量轨迹数据对于时空轨迹挖掘的效率问题是一个很大的挑战。云计算提供了一种新的并行计算模型,为挖掘海量数据提供了一种高效的解决办法。本文利用MapReduce分布式并行编程框架实现海量时空轨迹数据挖掘,研究云计算环境下时空轨迹频繁模式挖掘算法,取得的主要成果如下:1.提出了基于停留点的兴趣区域发现方法。在时空轨迹数据中有些坐标点有着重要的意义,例如用户到某商业中心购物,那么时空轨迹中位于商业中心内的采样点就有了具体的含义,如何通过时空轨迹中的坐标点发现感兴趣的区域(如商业中心)对于理解用户行为具有重要的意义。本文提出了基于时空轨迹中的停留点发现更有意义的兴趣区域从而挖掘出更有意义的频繁模式。首先将地理空间划分为一个个网格空间,然后计算每个网格单元中轨迹停留点的个数,对于大于一定阈值的网格则认为是兴趣网格,然后对兴趣网格进行合并从而发现兴趣区域。2.提出了基于网格划分的子轨迹频繁模式并行挖掘方法。随着定位技术的广泛使用,每天产生海量的时空轨迹数据,单机环境下很难快速有效地挖掘出其中的频繁模式,利用并行环境提高时空轨迹挖掘效率是一种有效地解决办法。本文利用轨迹数据的空间特性,首先通过网格对地理空间进行划分,则轨迹落到不同的网格单元中,然后并行地处理每个网格中的轨迹数据,同时为了避免网格划分过程中,同一个模式中的轨迹落入到相邻网格中的情况,每个处理节点同时处理相邻网格中的轨迹,最后挖掘出轨迹中频繁模式。3.提出了基于后缀树的轨迹频繁模式并行挖掘方法。时空轨迹数据是移动对象在时间维上的空间位置序列,频繁的位置序列体现了移动对象的出行习惯。提出通过后缀树并行挖掘时空轨迹中的频繁位置序列。首先根据地理空间中的兴趣区域以及轨迹中的停留点将时空轨迹转换成带有时间标签的兴趣区域序列,然后根据兴趣区域序列构建后缀树并挖掘频繁模式,为了提高了算法的效率,利用MapRedcue编程模型并行地构建后缀树并挖掘频繁模式。
其他文献
吴天明是中国第四代电影导演的代表,西部电影的开拓者。在他长达30多年的艺术生涯中,包括联合执导的《亲缘》和暂未公映的《百鸟朝凤》在内也仅仅只有八部,《人生》、《老井
<正>柴科夫斯基是俄罗斯伟大的音乐家、作曲家。在他的音乐作品中充满着热烈、诚挚的情感色彩,而且,在他的音乐旋律中独具俄罗斯民族特有的风格,他天才地将尽可能严密的音乐
目的观察高血压并发心力衰竭(心衰)患者联合使用富马酸比索洛尔及盐酸贝那普利的治疗效果。方法 85例高血压并发心衰患者,按照完全随机化分组原则将其分为对照组(42例)和观察
塔河油田缝洞型碳酸盐岩油藏以大型溶洞、溶蚀孔洞及裂缝为主要储集空间,其非均质性极强,且多种流动方式共存,勘探开发属于世界级难题。由于塔河油田油藏地层水矿化度高及油
本文通过对以城市土地集约利用理论、支持向量机理论和蚁群算法理论作为理论指导,并结合当前我国新型城镇化建设背景,运用定性与定量分析、规范研究与实证研究相结合的研究方
护理人力资源作为卫生资源的重要组成部分,决定了医院的护理工作质量,病人满意度,体现了医疗机构的竞争力。但护理人员较高的流动率作为突出的社会问题逐渐成为全世界的共识
自我国实施新课程改革以来,陆续颁布了义务教育的各项新课程标准。就音乐课程而言,国家教育部2013年颁布的《全日制义务教育音乐课程标准(实验)》,是音乐教育改革中极为重要
<正>2008年中国第三次死亡原因回顾性抽样调查[1]显示,卒中已经超过癌症和心血管病,成为我国居民第一位死亡原因。众所周知,脑卒中多发于中老年人,但近年来,青年卒中(18~44岁
目的通过超声测量瘢痕子宫妊娠晚期瘢痕区肌层厚度来判断其瘢痕愈合情况,从而为其分娩方式的选择提供依据。方法选择瘢痕子宫再次妊娠者52例,以剖宫产术后2年为界限进行分组,
半航空时间域电磁法集成了地面和航空电磁法各自的优势,不仅容易实现大发射磁矩,增大勘探深度,同时还可以提高勘探效率。但是由于半航空时间域电磁法在测量过程中,收、发距会