轨迹数据挖掘的方法研究

来源 :苏州大学 | 被引量 : 3次 | 上传用户：sdrb_123456

【摘要】

：

随着移动通信设备的普及和GPS定位技术的迅速发展,获取用户及车辆在移动过程中产生的轨迹数据手段越来越丰富。海量轨迹数据背后蕴含的价值引起了学术界广泛的研究,也取得了

【作者】

：

徐广根

【出处】

：

苏州大学

【发表日期】

：

2018年01期

【关键词】

：

轨迹挖掘 LDA主题模型马尔可夫模型长短时记忆网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着移动通信设备的普及和GPS定位技术的迅速发展,获取用户及车辆在移动过程中产生的轨迹数据手段越来越丰富。海量轨迹数据背后蕴含的价值引起了学术界广泛的研究,也取得了大量研究成果。特别是随着基于地理位置服务的手机应用软件不断涌现,准确、可靠地挖掘轨迹数据中的知识模式给用户带来更加良好的体验显得尤为重要。本文主要从两个方面挖掘轨迹数据:第一,提出了一种基于LDA(Latent Dirichlet Allocation)主题模型的电信轨迹恢复算法;第二,提出了两种预测稀疏轨迹终点的方法。主要研究工作如下:(1)针对当前的轨迹缺失恢复算法大多需要引入路网数据,而获取路网数据较为困难的问题,本文提出了基于LDA主题模型的电信轨迹恢复算法。通过将用户电信轨迹在时间和空间上进行预处理,映射生成时空单词矩阵。再对该矩阵划分训练集和测试集,将电信轨迹恢复问题转化成矩阵缺失补全问题。实验结果表明,使用LDA主题模型的电信轨迹恢复精度比传统矩阵补全NMF(Non-negative Matrix Factorization)算法在F1-score@5上提升了17%,训练时间减少了37%。(2)针对大多数传统轨迹终点预测算法都是通过计算轨迹之间的相似度来预测给定轨迹的终点,忽略了轨迹数据时间序列之间的前后联系,导致预测结果误差较大的问题。因此,提出了一种基于马尔可夫模型的稀疏轨迹终点预测算法。同时,针对移动对象运动的样本空间提出了基于K-d tree的网格划分方法。实验结果表明,相比轨迹相似度算法,基于马尔可夫模型的轨迹终点预测算法精度提升了46%。(3)针对传统LSTM模型预测轨迹终点算法,忽略了轨迹终点分布先验知识和只利用了轨迹单个方向变化的信息,导致训练过程困难且不能充分利用轨迹数据上下文信息,预测精度较低的问题。本文针对传统LSTM模型预测轨迹终点算法存在的两个缺陷分别进行改进。第一,利用Mean Shift聚类算法对训练集中轨迹的所有终点聚类,将城市划分成若干个区域和对应区域的中心点位置,再在传统LSTM模型后面加上Softmax层,预测得到属于每块区域的概率,通过概率和对应区域的中心加权求和得到预测轨迹终点;第二,将传统LSTM模型中的单向LSTM替换成双向LSTM,可以更加有效地学习轨迹数据中的上下文信息。实验结果表明,相对只考虑上一个时刻状态的马尔可夫模型和传统LSTM模型,改进LSTM模型预测轨迹终点的算法在精度上分别提升了13%和28%。

其他文献

Sn-Bi系列无卤素低温锡膏的研制

针对Sn-Bi系列低温钎料研制了一种无卤素焊锡膏,着重探讨了不添加卤素活性剂的复合方法,并对制备的活性剂进行了分解能力测试,同时就该活性剂研制的锡膏进行了润湿力和扩展率

期刊

Sn-Bi锡膏钎焊卤素

山东省临沂市浅层地热能特征及开发利用

“临沂市浅层地温能调查评价”项目是山东省国土资源厅认真贯彻落实十八届五中全会和省委省政府节能减排、大力推进生态文明建设的有关要求,为促进浅层地温能开发利用,推进开发利用新能源进程,实现政府节能减排目标,而开展的临沂市浅层地温能调查评价并建设开发利用示范工程和动态监测体系。项目工作起止2015年10月-2016年12月。经过近1年的资料收集、野外调查、勘探、试验及室内测试等工作。项目通过收集已有工程

学位

临沂市浅层地温能赋存特征适宜性分区

环境胁迫对尼罗罗非鱼抗无乳链球菌免疫应答的影响研究

尼罗罗非鱼(Oreochromis niloticus)是我国重要经济养殖鱼类。近年来,由无乳链球菌(Streptococcus agalactiae)感染引起的罗非鱼无乳链球菌病频繁发生,给该产业造成了严重经

学位

尼罗罗非鱼无乳链球菌环境胁迫免疫反应疫苗效力

激发小学生写作兴趣的三点策略

在小学作文教学中,教给学生一些写作方法,有利于提高学生的写作兴趣,使学生在写作上取得事半功倍的效果。兴趣是最好的老师,有了浓厚的写作兴趣,学生才能迸发写作热情,进而产

期刊

小学生写作作文素材积累素材学生习作小学语文教学

南京市首个固定资产投资项目节能评估报告通过评审

<正>[本刊讯]受上海梅山矿业有限公司的委托,江苏省节能技术服务中心(简称“中心”)对上海梅山矿业有限公司山景尾矿库工程项目进行了节能评估。

期刊

固定资产投资项目上海梅山矿业有限公司南京市

情态动词“能”的认知研究

本文在认知语法情境植入理论视野下探讨情态动词“能”的情境植入功能和结构“NP能VP”的语义建构过程.在认知语言学情境植入理论框架下,情态动词“能”充当一种情境植入成分

期刊

情态动词“能”认知语法情境植入

塞罕坝山杏幼苗萎蔫系数的研究

该文通过对塞罕坝山杏萌芽期10cm、20cm苗高时期萎蔫系数的研究，探索出了山杏在砾石土土壤条件下幼苗各个发育期对土地水分的最低要求，填补了山杏生态特性的部分空白，为山杏育苗

期刊

山杏幼苗萎蔫系数

从美学角度解读《月亮与六便士》

历代哲学、文学、艺术的核心之一就是对美的探索和追求,本文尝试从美学的角度,对英国小说家威廉·萨默赛特·毛姆的长篇小说《月亮与六便士》进行解读,通过小说中三位人物对

期刊

月亮与六便士毛姆美学创造美维护美

我国企业多元化经营业绩分析

利用层次分析法 ,对随机抽取的上市公司多元化经营状况进行了实证分析 ,指出了我国企业多元化分布的特征、经营状况、存在的主要问题 ,提出了我国企业多元化发展的方向 :应致

期刊

多元化企业绩效一体化主导

出口蘑菇罐头有新说法

出口蘑菇罐头有新说法国家外经贸部、商检局为保证产品质量，促进蘑菇罐头出口有序发展，对出口蘑菇罐头的质量管理作出新规定。１．蘑菇罐头和盐水蘑菇必须在经过商检卫生注册或登记

期刊

盐水蘑菇商检局

轨迹数据挖掘的方法研究

与本文相关的学术论文