定位数据的预测算法与应用研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:jason23431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无线通信系统的快速发展和广泛应用及智能手机的普及,获取用户的位置信息已经变得越来越容易。海量的定位数据中蕴含了大量时间序列信息,这些数据具有时间上的连续性和空间上的相关性,利用这些信息可以对定位数据进行分析和预测。定位数据能反映出人群密度的变化情况,预测定位数据对人群异常事件的检测和安防部署预警都具有重要意义。本文主要使用腾讯公开的定位数据,首先对采集到的数据进行分析和预处理,然后研究ARIMA(Autoregressive Integrated Moving Average Model)等基本的时间序列预测模型,并在基本的时间序列预测模型基础上研究多步预测策略和分层预测算法,随后分别建立基于GBDT(Gradient Boosting Decision Tree)和LSTM(Long Short-Term Memory)的预测模型并进行优化和实验,最后将定位数据的预测应用于人群异常事件检测和安全部署预警任务。本文的主要工作和贡献有:(1)优化基于GBDT的预测模型。提出基于GBDT的Moving Normalization机制并针对GBDT模型特点进行特征设计。在基于GBDT的预测模型中,当数据分布产生变化的时候,基于树的GBDT模型很难快速学习到数据的变化,因此本文提出Moving Normalization机制,通过对输入数据进行归一化和对预测结果进行重新分布来解决这个问题。通过实验得出本文中提出的GBDT中的Moving Normalization机制在数据分布未发生变化时非零数据平均绝对百分比误差由14.9%变为16.8%,误差增加不显著,在数据分布发生变化时非零数据平均绝对百分比误差由24.9%下降到17.5%,误差降低显著,说明Moving Normalization机制能有效解决GBDT在数据分布发生变化时难以学习到这些变化的问题。此外由于GBDT模型很难自动提取空间特征和抽象模式特征,因此本文设计了适合GBDT模型学习的时间序列相关特征并使用聚类和卷积来提取定位数据的空间信息。实验表明增加本文设计的时间序列特征和空间特征及聚类信息相对于只使用原始数据进行预测,非零数据平均绝对百分比误差由18.5%降低到14.9%,说明本文设计的特征能有效降低预测误差。(2)优化基于LSTM的预测模型。在基于LSTM的模型中尝试使用双向LSTM结构并引入Batch Normalization机制。在基于LSTM的预测模型中,针对神经网络容易梯度弥散等问题本文尝试在LSTM中引入Batch Normalization机制并实验了双向LSTM结构的效果。实验表明双向LSTM结构将预测的非零数据平均绝对百分比误差由1 9.4%降低到18.4%,能有效降低预测误差。(3)进行了定位数据预测算法的应用研究。设计了一套应用系统,该系统能够自动完成数据预处理、训练特征提取、定位数据预测和基于预测结果的安防部署预警和异常事件监测功能。应用了定位数据分层预测策略,将定位数据预测问题建模为分层数据预测问题,设计了分层一致误差损失函数。研究了多步预测策略,应用多步预测策略,将模型的单步预测结果转换为多步预测结果。
其他文献
自身免疫性肝病是指一组以肝脏病理损害和肝功能异常为重要表现的非传染性肝病,其发病机制可能与自身免疫有关,主要包括自身免疫性肝炎(autoimmune hepatitis,AIH),原发性胆
社会主义新农村建设是我们党从全面建设小康社会的全局出发作出的重大决策,是新世纪、新阶段解决"三农"问题的重大战略部署。但农村科技实用人才匮乏问题依然在很大程度上限
讨论了移动商务的概念及其技术解决方案,分析、探讨了基于移动商务的新型企业经营管理模式及其所面临的问题.
论文主要针对重庆城市交通发展中一种解决城市交通的新方式巴士快速交通系统(BUS RAPID TRANSIT简称BRT)进行研究。BRT是一种介于轻轨交通和常规交通之间的新型营运系统,是一
<正> 公需是最近出现的一件十分珍贵的青铜器,失盖,仅存器身,高11.8厘米,口长24.8厘米。我最早看到时, 的腹足大部尚覆有土锈,间以包里的席痕。其内底的铭文也有多处被锈掩
[目的] 妊娠期肝内胆汁淤积症(Intrahepatic cholestasis of pregnancy ICP)是妊娠特有的疾病,对胎儿危害极大,而ICP患者胎儿缺氧的机理目前尚不清楚。缺氧诱导因子HIF(hypoxia
自经济转轨以来,俄罗斯与东欧转轨国家经济深受美元化问题之害,各国去美元化的努力由于全球金融危机的爆发而遭受重大打击。本文首先从货币替代和资产替代两个层面衡量了转轨
本文在认知语言学的总体框架下,结合现代隐喻学理论和文体学的有关知识,在前人研究成果的基础上深入系统地探讨了隐喻在科技语篇这种特殊文体中的特殊表现,旨在进一步揭示隐喻和
认知研究对人类探索自身及人类与自然的奥秘非常重要,也非常有意义。本文从哲学角度对认知研究进行了一番思考,认为认知的生理、心理和社会过程是认知得以实现的三个基本过程