面向移动轨迹大数据的查询检索和挖掘算法的研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:erbin517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来GPS技术的快速发展以及手持设备的大量普及,人们可以越来越便利地记录位置信息,并上传至管理服务器。根据时间先后顺序排列的这些记录,形成了用户的行动轨迹。由此,大规模用户的轨迹数据得以采集。本文关注用户轨迹大数据的管理查询,签到轨迹数据特征的抽取分析以及地点预测等相关研究。如何有效管理轨迹大数据,是研究学习轨迹数据的前提条件。学习用户的轨迹数据,理解用户的行为模式,能在智能推荐、路径规划等多种商业应用中大显身手。轨迹数据的处理分析是时空数据研究的重要分支。相比一般的时空数据,轨迹数据结构更加复杂,给存储管理和分析挖掘造成了更大的挑战。本文对轨迹数据从存储索引、查询优化、分析处理和挖掘理解等方面开展了一系列的研究工作,开发和设计了一些索引结构、模型和算法。具体而言,本文的研究工作从三个方面顺次开展:1.基于出行时间的轨迹查询:在同时考虑地理位置和到达时间的基础上,本文提出一种新的时空轨迹查询。给定一组查询地点,该查询在轨迹数据库中找到一组轨迹,使得从这些轨迹的点出发到所有查询地点的时间之和最少。为了有效处理该查询,本文提出为每一个查询地点在线生成候选轨迹列表,在该列表中轨迹按照其与查询地点的到达时间排列。根据这些候选列表依次迭代生成的候选轨迹,经过进一步剪枝和验证,最终筛选出满足条件的轨迹。2.基于时空关键字的轨迹范围查询:为了更好的利用社交网络中的带文本的用户轨迹,本文提出对于带有文本信息的轨迹范围查询。给定查询地理区域、时间范围和一组查询关键字,该查询的目标是找到在查询时间范围内经过该查询区域的轨迹,且包含所有的查询关键字。为了加快此类范围查询的处理效率,本文提出新的索引结构IOC树。该结构结合了倒排索引和octree的思想,根据空间、时间和文本限制进行快速剪枝。此外,该结构同时支持关键字有序情况下的变形查询。3.面向多场景下的地点预测:社交网络用户的签到记录根据时间先后顺序排列成用户的行动轨迹,根据用户轨迹预测其下一个签到地点是一项基本的数据挖掘任务。该任务主要的挑战来自数据稀疏性和场景的多样性。本文提出一种基于特征融合的通用预测模型,在各种场景下均能取得较好的预测效果。该方法利用核密度估计模型对地理位置信息建模,矩阵分解方法对协同信息进行建模,并利用图结构抽取用户时序签到信息的转移模式。基于以上研究工作,本文对用户轨迹数据的多个方面进行了深入的研究和讨论,力求提高轨迹数据的处理效率,深刻理解轨迹大数据内在蕴含的知识,学习用户的行为模式。大量的在实际数据集上的实验,可以证明本文工作的有效性和适用性。
其他文献
诚信与合作是我国构建和谐社会主义,促进人文发展的核心价值体系,也是我国高校思想政治教育对学生道德品质培养的基础标准。因此,本文针对高校思想政治教育中诚信与合作的培
采用RFQ、B IS/BAS和LOT-R对331名企业新员工和920名在校大学生施测,以探讨H iggins等提出的调节定向测量维度在中国文化中的适应性及其问卷(RFQ)的信度和效度。结果表明:(1)
目的针对目前静态检测方法血压依赖性造成的敏感性不足和需要血压校正的问题,找到一种对动脉亚临床病变引起的弹性减退更敏感且无需血压校正的指标,并设计一种适用于家庭和社
小麦品质除了受品种的遗传因素影响外,还受气候环境条件和栽培措施的影响。本文旨在研究不同耕作方式对小麦品质的影响,以期探索合理的小麦种植方式;同时,在施氮、磷肥一定量
将存在功能缺失的民间金融体系引入包含自然资源开采、制造业、中间产品和R&D的四部门内生增长模型,分析了资源富集地区资源开发、民间金融与区域经济发展之间的互动关系。结
地下盾构轨道在线路的选择上,由于受规划及建、构筑物的制约,通常需要采用小曲率半径的曲线隧道绕过城市中密集的建筑物和各种管道等障碍物,从城市地下隧道的长远发展来看,小曲率
目的分析中晚期肝癌的异常血液供应及对介入治疗的影响,旨在提高肝癌介入治疗的疗效。方法收集肝动脉化学治疗栓塞术(TACE)的中晚期肝癌患者资料143例,其中男性117例,女性26
研究了熊胆茶的肝保护作用及其抗炎免疫作用.结果显示:熊胆茶对四氯化碳(CCl4)和D-半乳糖胺(D-Galn)致小鼠的肝损伤有明显的保护作用,可使血清中谷丙转氨酶(ALT)、谷草转氨酶
由于岩溶发育的不均一性,传统的钻探方法在岩溶调查进行过程中,不仅耗费大量时间与财力,而且由于钻孔数量有限,控制点稀少、信息量小,不易于全面掌握工区岩溶发育情况。为了使岩溶
为了研究断层破碎带在采动影响下的变形破坏失稳过程,采用电镜、薄片分析及蠕变力学试验方法分别对范各庄矿F0断层物质的原样和3种含水量、5组样品的复制样进行了分析研究。