基于NoSQL数据库的大规模轨迹数据管理和聚类分析方法

被引量 : 0次 | 上传用户:njtangxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着民用GPS(全球定位系统,Global Positioning System)等定位设备在移动终端上的广泛使用以及基于位置服务(Location-Based Service)和移动社交网络(Mobile Social Network)的发展和普及,大量的轨迹数据在日常生活中正在日益积累并为不同类型的应用所服务,大范围轨迹数据的管理、索引和分析越发显得重要。本文以移动对象轨迹为研究对象,以移动对象存储、查询和分析为主要目标进行研究探讨。本文主要从三方面解决移动对象数据库的几个关键性问题。(1)轨迹数据管理方面:本文分析移动对象数据模型,采用NoSQL分布式数据库存储大规模移动对象的轨迹数据,并对大规模的轨迹数据插入和查询进行了性能优化;(2)轨迹索引方面:本文提出轨迹R树混合索引来提高轨迹查询效率,设计轨迹R树、哈希表和B树的轨迹混合索引,实现了索引内外存交互机制和索引缓存机制,并对轨迹索引的层次性查询算法做了详细介绍。通过时空生成器生成的模拟轨迹数据集,将本文的轨迹R树混合索引同经典的TB树做了索引创建性能和查询性能的实验对比,并对实验数据进行分析。实验表明,本文提出的轨迹R树混合索引方法具有良好的索引创建性能和查询性能;(3)轨迹数据聚类分析方面:本文基于数据挖掘知识对轨迹模型、轨迹划分和轨迹相似度进行问题定义。通过时空数据生成器提供Olburgen路网数据和轨迹模拟数据,在轨迹混合索引减小聚类查询空间从而进行局部轨迹邻近查找的基础上,本文提出基于密度的大规模轨迹聚类方法,并通过实验测试对聚类结果进行分析。实验分析表明本文的基于密度的大规模轨迹聚类方法具有良好的聚类分析能力和高效的聚类分析。
其他文献
为实现鱼新鲜度的快速定性、定量分析。采用电子舌技术对4℃下不同冷藏天数的鲳鱼进行检测。同时测量鲳鱼体内挥发性盐基氮(Total volatile basic nitrogen,TVB-N)含量及细菌
<正>2008年5月8-9日中国·北京中国仓储协会作为全国仓储行业的社团组织,一直致力于促进我国仓储业的现代化;致力于推动我国现代物流业的发展(参见www.caws.org.cn)。危险品
语言单位的有标记与无标记现象张国宪一引言现代科学发展的总趋势之一是科学的整体化,即各种知识体系趋于统一。这种整体化表现在研究方法上就是各种学科研究方法的互渗性。比
劳务派遣目前在我国发展迅速,成为一种重要的用工方式。虽然2008年实施的《劳动合同法》出台以后有了和以前劳动法不同的规定,但是近年来的实施中仍存在许多问题,本文旨在通
对千年科举考试终结地的考察,可知最后两场会试迁移到河南贡院(今河南大学)举行以及终在光绪三十一年(1905)被废除,并非由科举制度所必然导致,而是由当时内忧外患的形势所迫
絮凝形态学是目前混凝领域研究的热点之一。采用Al-Ferron逐时络合比色法和电喷雾质谱(ESI-MS)法证实了混凝过程中铝低聚体在弱酸性pH值条件可原位转化生成Al13形态。预制和原
分析基于GJB6600的交互式电子技术手册(IETM)浏览使用需求基础上,提出基于GJB6600,满足国家安全保密要求的自主可控IETM浏览平台框架及软件实现技术架构。在自主可控IETM浏览
初中心理健康活动课中运用的"小故事",包括童话、心理案例以及引用自文学作品的故事情节,它们形象、深入浅出、符合学生的心理特点,在初中心育课中大有用武之地。基于此,从课
随着中韩两国在政治,经济,文化等各领域的交流日益深入和频繁,大学里学习韩语的人数越来越多,只学好一门外语已经不能满足人们获取信息以及日益扩大的交际需求。因此我院英语
萧红、张爱玲小说创作的史学评价惊人地类似:一度被打入冷宫,一度又大红大紫;她们的创作也都有“细”和“隔”的特征。通过对这种史学评价的探讨,可以建立一种包容的、个人化