基于序列自编码器的移动轨迹异常检测方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:zl74531
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动定位设备的不断发展与应用,大量移动轨迹得以被采集并保存。如何有效分析这类轨迹数据一直是众多研究者们的关注重点,其中异常轨迹检测作为轨迹数据挖掘的重要部分,被广泛应用于人群轨迹监控、海事船舶运动、灾害天气预警和城市交通管理等领域。在智能化信息时代背景下,公交、出租车等车辆轨迹数据持续增长,本文以车辆移动轨迹数据为研究对象,针对异常轨迹检测问题进行进一步的研究与改进。主要研究内容如下:1.针对车辆轨迹时空特征提取不全面的问题,本文充分考虑轨迹时空特征并提出融合时序和空间特征的车辆异常轨迹检测方法。在序列自编码器基础上引入自注意力机制提取轨迹时序特征,同时利用全连接神经网络提取轨迹偏转量和行驶距离等空间特征,然后进一步融合轨迹时空特征。在波尔图和北京市出租车轨迹数据集上的实验结果表明,本文所提方法能够有效提取轨迹时空特征并提升异常轨迹检测精度,与近年来的代表性方法相比在准确度和F1评分上均有不同幅度的提升。2.针对车辆轨迹标注不充分、异常轨迹占比较少等问题,提出基于改进变分自编码器的车辆异常轨迹检测方法。该方法主要利用双向门控循环单元学习轨迹前向和后向关系,并引入自注意力机制赋予特征不同权重,以提高隐空间特征分布的准确性,最后利用生成概率计算轨迹的异常分数。在波尔图和北京市出租车轨迹数据集上的实验结果表明,所提方法能够通过无监督学习降低人工标注成本并解决由正负样本不均衡导致的训练困难问题,从而提高异常轨迹检测准确度。3.基于面向对象的原理和B/S架构,设计并实现异常轨迹检测的原型系统,并将本文提出的融合时序和空间特征的车辆异常轨迹检测方法和基于改进变分自编码器的车辆异常轨迹检测方法集成到原型系统中。该系统能够实现模型训练和异常检测过程,并使用地图和表格展示轨迹数据和最终的检测结果。
其他文献
随着我国电商行业的发展,各大电商平台需要更加个性化、智能化的方法提升平台的收益以及用户的购物体验。对用户的消费偏好的研究可以准确预测电商平台广告点击率,从而有效实现精准营销和个性化推荐。本文从电商平台用户历史行为序列和商品特征属性两个方面出发,深入电商平台用户、商品特征隐藏的用户兴趣研究。本文贡献总结如下:1.基于用户行为序列特征层面,针对传统循环神经网络处理时序数据的优势但忽略输入序列时间间隔的
学位
社交媒体是互联网飞速发展的产物之一,民众通过社交媒体交流信息已变成日常生活中必不可少的一件事情。微博作为热门的社交媒体之一,其特点是使用方式简单便捷、实时性高以及传播迅速,并因这些特点成为了国内民众表达情感和分享日常的重要渠道。微博拥有十分庞大的用户群体,每天都能产生海量含有民众情感的微博文本,微博文本成为了国内舆论走向的代表之一,因此对微博文本进行情感分类研究,可以挖掘出微博文本中的情感信息应用
学位
不平衡分类问题一直是机器学习、模式识别和数据挖掘领域的研究热点。目前分类器大多都是基于平衡数据集进行设计的,因此对不平衡数据集,其分类结果往往偏向多数类,降低了模型的泛化性能。面对现实生活中大量的不平衡数据集,如何从中学习到拟合能力较强的模型具有十分重要的现实意义与应用价值。目前,有许多采样和代价敏感学习等方法可以减少不平衡数据对分类性能的负面影响,其中采样中的过采样方法是最常用的一种数据预处理方
学位
唇语识别的目的在于利用视觉信息弥补听觉通道的不足,广泛应用于监控视频语音还原、噪声环境语音增强等领域。唇语识别的挑战体现在其涉及两种感知通道的转换,唇语本身具有多义性、多样性,以及唇部细节视觉特征的表示与理解,也是导致现有的唇语识别技术仍面临着流畅度不高、可懂度低等问题的原因。改善这一问题的关键在于如何获取更丰富的唇部变化的细节信息并挖掘其时空相关性。为此,本文从注意力机制和多分支时间卷积网络两个
学位
报纸
建设造福人民的幸福河湖是新时期河湖治理的目标,构建幸福河湖评价指标体系是检验河湖治理成效的重要手段,河湖水生物评价指标是幸福河湖评价指标体系的关键内容。以某省幸福河湖评价办法为例,笔者从幸福河湖评价体系总框架、水生物评价指标选取、涵义及测算方法等方面进行了探讨研究,分析了幸福河湖水生物评价指标的代表性、监测与评价标准的统一性、调查结果的准确性及评价结论的可靠性,以及水生物评价指标体系构建面临的问题
期刊
目的 基于标化表观扩散系数(ADC)值预测膀胱癌患者人表皮生长因子受体2(HER2)的表达状态。方法 回顾性研究127例膀胱尿路上皮癌患者的术前盆腔3.0T核磁共振(MRI)扫描图像,计算标化ADC值。采用免疫组织化学法(IHC)检测术后组织标本中的HER2表达状态。在HER2各表达水平间、不同表达状态划分间比较标化ADC值的差异。标化ADC值与HER2表达状态行相关性分析。受试者工作曲线(ROC
期刊
图像作为最简洁和最具表现力的视觉语言,在当前这个信息时代占据着举足轻重的作用。由于成像设备的不完备以及拍摄技术的不成熟,导致获取的图像所表达的信息不清晰,难以满足现实需求。而解决图像质量的一种常用手段是多聚焦图像融合。多聚焦图像融合作为一种提升图像质量的有效方法,通过手工设计的融合规则将同一场景下多幅不同焦距的图像融合成一幅全清晰的图像。现有的方法根据使用的技术被划分为:基于传统的方法和基于深度学
学位
随着互联网的蓬勃发展,越来越多的人愿意在社交网络中交友与生活。所以用户往往拥有多个社交网络账号。但由于平台之间的封闭性,同一用户在不同社交网络平台中产生的数据无法有效连通,这为跨网络数据挖掘任务带来了困难。因此,社交网络用户对齐成为一个关键的研究问题。对于社交网络用户对齐来说,基于表示学习的模型已被证明是有效的方案,这类模型通常采用节点之间的特征传播与聚合的模式来学习节点的特征。然而,对于密集的子
学位
近年来,幸福河湖成为国家生态文明建设的重点工作,广州市依托“互联网+河长制”积极探索幸福河湖建设,并逐渐摸索出了一条水环境治理的“中国式现代化”道路。本研究基于广州市2012—2022年水污染治理的跟踪调查资料,将幸福河湖划分为“平安之河”“健康之河”“宜居之河”“文化之河”“和谐之河”五个维度,围绕“互联网+河长制”如何赋能幸福河湖建设这一核心问题展开研究分析。
期刊