基于轨迹数据的频繁项挖掘技术研究

被引量 : 1次 | 上传用户:onlysimon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着传感器网络、全球定位系统(Global Positioning System,GPS)和无线通信等技术的不断发展及普及,应用服务器中积累了大量移动用户运动轨迹的时空数据。通过对用户历史轨迹数据进行分析,可以发现许多用户频繁地在固定的时间区间内总是访问固定的地理区域。从移动用户历史轨迹中挖掘隐含的、有效的时空频繁模式是数据挖掘领域中一个重要的研究课题,对诸如压缩移动数据、实现移动对象的分析和预测、为用户提供个性化的位置服务、发现区域社会行为规律、交通管理决策和商业推广等具有重要作用。针对移动轨迹的热门区域发现算法忽略密集到访时间的问题,结合时间属性和空间属性,对轨迹数据的时空频繁模式挖掘展开研究。首先,分析现有停留区域识别方法及存在的问题,在已有方法的基础上提出一种改进的自适应多粒度停留区域识别方法,该方法先对用户轨迹进行分段,然后区分步行段和非步行段,最后使用能满足不同空间粒度的Clustering II算法对步行段聚类。识别出的停留区域将作为下一步的频繁时空项挖掘的基础。其次,集成时间和空间属性提出时空项和频繁时空项的概念。频繁时空项可以表示用户频繁在哪个时间区间到访哪个地理区域,提出一种基于3D网格的频繁时空项挖掘算法。该算法主要分为三步:第一、生成时空项。通过基于密度的聚类算法识别出用户的停留区域并对用户id、停留区域、停留时间段各元素进行表示,进而生成时空项。第二、将时空项映射到3D网格。将包含经度、纬度、时间的时空项映射到事先设定的集成时间和空间维度的3D网格中,并记录每个单元3D网格的支持度。第三、提取合并相邻单元3D网格生成频繁时空项。提取满足用户定义最小支持度的单元3D网格并将相邻的单元3D网格进行合并,进而生成频繁时空项。最后,在真实轨迹数据集上进行实验,实验结果表明,本文提出的方法能够从时空轨迹数据中挖掘出不同支持度的频繁时空项,该时空频繁项能够正确反映出用户频繁在哪个时间区间到访哪个地理区域,并且具有较好的性能。
其他文献
韩国20世纪90年代金泳三执政期间发起了旨在改变政经勾结腐败政治的改革,但收效甚微。这场政治改革的失败暴露了韩国政治结构中存在的权力过度集中、政党私党性、地区割据主
本文是对改革开放以来中国外交进步与转型的一种评估。作者认为,在过去的三十年,中国外交正在形成静悄悄的革命,其演进方向与全球进步的潮流是一致的,即:更加慎重的军事力量
温度检测与控制是生产过程中最普遍的需求,而且也是过程管控的重要任务之一。利用微机控制技术、应用传感器技术、无线电通信技术和计算机技术进行实时控制、温度检测、数字
国家对国际司法程序的态度问题尚未在国际法学界引起足够重视,本文从比较国家对ICJ和WTO争端解决机制的态度出发,从一个侧面入手,分析国家对国际司法程序的态度问题。本文通过数
<正>古代"海上丝绸之路"曾为繁荣亚非欧国家经济、推动东西方沟通作出重要贡献。今天"海上丝绸之路"是中国拓展经济发展空间、构建和平稳定周边环境的战略举措,也是促进沿线
多任务学习是机器学习、数据挖掘领域中一门非常重要的研究分支,旨在面对任务样本来源于不同分布且样本容量过低的情况下,促使多个任务同时学习以降低系统的泛化错误。而实际
本文以河南邓州方言民俗词语为立足点,通过大量田野实地调查,整理出邓州方言词汇表,并以此为基础选取了婚姻、生育、丧葬、饮食、生产、岁时、游艺等七类最能表现其地民俗文
文化的定义有上百种,见仁见智,众说纷纭。一般来说,狭义的文化是指文学、艺术、教育和科学等精神财富。最广义的文化则指人类社会历史发展过程中所创造的物质财富和精神财富
背景:颅骨修补术不仅能恢复患者颅骨结构的完整性及外观的美观程度,还能减轻颅骨缺损给患者带来的心理负担,终止缺损造成的继发性脑损伤,促进神经功能的恢复。但颅骨修补术后