考虑端点条件和场景信息的行人轨迹预测方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：dududi

【摘要】

：

【作者】

：

李翔宇

【机构】

：

合肥工业大学

【出处】

：

合肥工业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

行人轨迹预测是计算机视觉领域的一个热点方向,在无人驾驶、智能交通、智慧城市和机器人自动导航等领域具有较为广泛的应用。基于传统统计模型的方法受限于人工确定的行人运动特征,并且缺乏在复杂拥挤环境中能通用的模型。近年来,基于深度学习的轨迹预测模型,凭借高效的特征提取方法、出色的可移植性、应用面广等优势而成为主流,但现有研究工作仍然存在两点不足:行人运动的不确定性对行人轨迹预测十分重要,然而大多数基于深度学习的轨迹预测方法在预测未来轨迹时,未做全面的考虑;场景信息对行人轨迹预测十分重要,然而现有方法很少考虑场景信息对轨迹预测带来的影响,从而影响最终的预测结果。本文研究考虑端点条件和场景信息的行人轨迹预测方法,主要工作如下:1)综述了现有行人轨迹预测方法,特别是基于深度学习的方法,并总结分析了这些方法的优缺点。2)提出一种基于生成对抗网络的端点条件轨迹预测模型（PECGAN）。PECGAN模型通过预测行人未来轨迹端点,降低了运动不确定性对轨迹预测的影响,从而使模型聚焦在轨迹预测任务上。首先,通过CVAE生成预测轨迹端点,将预测轨迹端点特征和行人过去轨迹特征融合。然后,利用自注意力机制对建模行人之间的社交互动,通过得到的社交互动特征推断出未来轨迹。实验结果证明了PECGAN模型的有效性和预测性能的优越性。3)提出融入场景信息的端点条件轨迹预测模型（PECGAN++）。该模型在PECGAN模型的基础上进行改进,并通过将行人的社交互动与场景信息融合来预测行人的未来轨迹。首先,利用自注意力机制提取行人过去轨迹之间的社交互动特征,将得到的社交互动特征通过CVAE生成预测轨迹端点。然后,通过卷积神经网络提取场景信息,将场景信息、行人之间的社交互动特征以及预测轨迹端点特征融合,共同推断出未来轨迹。实验结果表明,考虑场景信息后,PECGAN++模型能够准确地预测行人未来轨迹。

其他文献

无人机辅助边缘计算环境下的任务卸载和轨迹规划策略研究

随着智能移动设备越来越多的出现在我们的日常生活,物联网对计算资源的需求不断增加,计算资源受限成为物联网所面临的新挑战。移动边缘计算（Mobile Edge Computing,MEC）的兴起很好的解决了计算问题,但是结合了MEC技术的物联网仍然存在一些问题,比如固定部署的边缘服务器在处理任务时不够灵活、边缘服务器的成本昂贵等。于是无人机辅助移动边缘计算系统被提出,利用无人机的高机动性和灵活性,提供

学位

基于图神经网络的行人轨迹预测方法研究

随着智能系统的快速发展,如无人驾驶车辆、服务机器人导航、监视系统等,行人轨迹预测成为一个极具挑战性的问题。如何在高度拥挤、混乱的环境中感知、理解和预测行人的运动模式以便防止将来的碰撞变得重中之重。行人的运动不仅仅受到自身因素的影响,同时还受到周围环境的影响。针对上述问题,本文的主要研究内容如下:1.行人之间的交互是复杂多变的:单独行走、相向握手以及成群结队等,这些社交活动都会影响行人接下来的轨迹。

学位

基于深度学习的单模态和跨模态行人重识别研究

随着智能安防和视频监控领域的需求与日俱增,越来越多的视频监控设备被部署安装,从而导致监控视频数据量呈爆发式增长,为了对这些海量的监控视频数据进行智能分析,引入人工智能技术已成为必然趋势。其中,行人重识别技术作为智能分析的关键技术支撑,正受到广泛的关注和研究。行人重识别旨在解决跨镜头情景下行人跟踪与检索问题,它是利用计算机视觉技术判别在指定的图片或视频序列中是否具有指定行人的技术,在视频监控、智能零

学位

基于多维特征与注意力机制的步态情感识别

情感识别在诸多领域有着重要应用,如人机交互、辅助医疗等,一直以来都是工业界和学术界的重要研究内容。传统的情感识别,如面部情感识别,虽然被研究较多,但也在数据精度要求和隐私保护等方面有一定的缺陷。相比之下步态数据也蕴含情感信息,但对数据精度要求相对较低,且有助于保护隐私。利用步态信息进行情感识别的研究于近年来逐渐开始兴起,本文对基于步态的情感识别这一被研究相对较少的任务,对步态原始存储数据进行了不同

学位

基于域自适应目标检测的机务段调车信号识别模型研究

频发的货运铁路运输事故造成了严重的经济损失和恶劣的社会影响,在平面调车作业过程的闯蓝灯驾驶行为是诱发该类事故的主要原因之一,而该行为大多数归咎于驾驶员对调车信号的通行状态的误判、漏判。利用计算机视觉实现机务段调车场景下的交通信号灯识别,能够克服由于疲劳导致的肉眼错误判断等弊端,将有效服务于国家人工智能战略需求,同时也推进轨道运输转型升级创新发展。基于深度学习的交通灯目标检测模型依赖于海量的相关场景

学位

5G蜂窝网络中D2D通信的资源复用与分配方法研究

设备到设备（Device-to-device,D2D）通信技术允许邻近设备之间通过重用蜂窝频谱的方式直接通信,有效地提高了蜂窝网络的频谱效率,减轻了基站的负载压力,减小了端到端传输时延,成为5G通信网络的关键技术。D2D技术引入蜂窝移动通信网络在带来诸多好处的同时,也对蜂窝通信链路造成了干扰,若不能有效地协调干扰,将会严重影响蜂窝网络的通信质量。因此,本文针对两种不同的复用模式下的资源分配问题进行

学位

基于道路状态预测的VANET通信优化研究

车联网作为智能交通系统中的重要组成部分,在交通管理、智能运输和缓解交通拥堵等领域都发挥了非常重要的作用。其中车辆自组织网络（Vehicular Ad Hoc Network,VANET）是构成车联网的重要一环,通过车辆间的通信来传输有效数据。而随着车辆节点的增多,车辆密度的增大所带来的交通拥堵等一系列问题,可能会导致VANET中通信性能的下降。如何在当前复杂的道路交通环境中提高VANET的传输性能

学位

基于领域自适应的轴承剩余使用寿命预测方法研究

轴承是旋转机械中的关键部件,在现代工业系统中得到了广泛的应用。对轴承进行健康状态管理,准确地预测轴承的剩余使用寿命,能有效地改善机械系统的可靠性、安全性,防止出现重大故障,从而降低维护费用。随着大数据和人工智能等先进技术的发展,深度学习已经成为剩余寿命预测领域的热门话题。然而在实际工况下,基于深度学习的轴承剩余寿命预测方法的研究方法通常会有以下两个问题:（1）样本数据量不足,导致模型无法收敛;（2

学位

面向工业产品表面缺陷检测的改进RetinaNet模型研究及其应用

随着大数据及高性能计算技术的发展,深度学习近十年得到迅速发展,在人脸识别、自然语言处理等领域也取得了巨大成功,并于近年开始进入工业产品表面缺陷检测等工业领域。虽然深度学习在表面缺陷检测方面取得了很大进展,但仍然存在一些亟待解决的难题,小目标检测精度低和样本均衡性差便是其中的两个典型难题。通过充分调研了目标检测算法、小目标检测和样本不均衡的相关研究,本文选择以通用目标检测算法RetinaNet为基础

学位

针对自然视频的无参考视频质量评价研究

视频的获取及传输过程中,由于物理环境及算法性能的限制,其质量难免会出现无法预估的衰减,导致其在实际场景中的应用受到限制,并对人的视觉体验造成显著影响。因此,作为计算机视觉领域的一项重要任务,视频质量评价应运而生。其目的在于通过构建计算机数学模型来衡量视频中的失真信息以判断其质量的好坏,达到自动预测质量的效果。在城市生活、交通监控以及多媒体直播等多个场景中具有广泛的应用前景。本文主要针对使用较多的自

学位

考虑端点条件和场景信息的行人轨迹预测方法研究

与本文相关的学术论文