【摘 要】
:
基于第一视角视频对行人行为进行分析是近年来计算机视觉领域的一个研究热点,受到国内外研究学者的广泛关注,而运动预测作为行为分析中的一个重要任务,可以应用于自动驾驶、
论文部分内容阅读
基于第一视角视频对行人行为进行分析是近年来计算机视觉领域的一个研究热点,受到国内外研究学者的广泛关注,而运动预测作为行为分析中的一个重要任务,可以应用于自动驾驶、服务机器人导航等众多智能交通相关的领域中。本文的工作主要是在第一视角下,根据给定的视频片段,对视频中的目标行人的历史运动轨迹进行分析,从而预测其未来所处的位置。本文结合一维卷积神经网络和长短期记忆网络,提出了一个基于编解码结构的模型,对从视频帧中提取的行人位置和大小历史信息,相机自我运动信息进行建模学习。其中,相机自我运动的未来信息用于指导模型更好地预测行人未来的轨迹。采用长短期记忆网络对编码后的特征向量进行预测,然后对预测序列进行解码。为了评估所提出的预测模型的性能,依次在MOT16行人数据集、FPL行人数据集以及本文采集的FPP行人数据集上进行了测试,并与其他轨迹预测相关算法进行比较。测试结果表明,本文提出的这一第一视角下的行人轨迹预测模型在对行人未来的轨迹进行预测时具有较好的性能。本论文的创新性主要包括以下几方面:(1)针对第一视角下的行人轨迹预测问题,根据一维卷积神经网络可以提取一维序列中的特征以及长短期记忆网络可以处理时序序列的特性,提出了结合两种神经网络的模型,即CNN-LSTM行人轨迹预测模型。(2)在模型中加入相机自我运动的未来信息,同行人位置和大小的历史信息以及相机自我运动的历史信息一起作为关键因素,指导模型进行预测,以提高模型预测精度。(3)针对当前行人轨迹预测研究工作中第一视角数据集较少的问题,采集并标注了一个全新的第一视角下录制的行人数据集,为以后类似的研究工作提供了建模所需的学习数据。
其他文献
目的:通过与临床常见的无创通气模式进行比较,探讨无创高频通气(noninvasive high-frequency ventilation,NHFV)治疗新生儿呼吸窘迫综合征(neonatal respiratory distress syndrome,NRDS)的安全性及有效性,为临床使用无创高频通气提供更多循证依据。方法:通过对国外数据库Pubmed、Wed of Science、Cochra
近十年来,得益于我国宏观经济的发展,A股市场的容量持续扩大,通过资产重组等方式催生了大量的“民资系族”。这些系族集团在我们的资本市场和实体经济都扮演着重要的角色,对
本文通过数值模拟研究燃烧器钝体和叶片对切圆方向和大小的影响,并设计工业试验针对锅炉出现的结渣问题和切圆反向问题进行燃烧器改造,有利于燃烧器的优化设计和锅炉的高效运
最近几年来,要约收购活动的日益频繁,为证券市场中的投资者创造了新的投资机会,其中以要约收购套利活动最为突出。由于要约收购价往往高于目标股票的最新收盘价,这一价差的出
发动机叶片的作业环境复杂多变,作业条件十分苛刻,承受较高的工作负载。且叶片是发动机暴露在外的一部分,易受到外力冲击,如突加载荷、不稳定气流等,由冲击载荷引起的动态响
作为微电网重要组成部分,储能系统在微电网中实际上是一种特殊类型的微电源。储能系统通过变流器为微电网提供一定的功率,实现削峰填谷、短时功率支撑等微电网功率调节功能。
本研究通过一次性腹腔注射diquat建立仔猪氧化应激模型,考察饲粮添加壳寡糖(Chitooligosaccharides,COS)对断奶仔猪生长性能、肝脏氧化还原状态、结构和功能的影响,旨在探讨C
当前,全国所有基层派出所几乎都面临着一个普遍问题—职权错位。职权错位问题是公安机关特别是基层派出所普遍存在且愈演愈烈的一大顽症,是中国公安机关的一块心病。特别是非警务活动的急剧增多,耗费了大量警务资源,让本就捉襟见肘的警务力量更加雪上加霜,对正常警务活动的负面影响越来越重。在非警务活动一旦处置出现问题,很容易给基层派出所带来非常深远的负面影响。不仅会是派出所成为矛盾的“暴风眼”,更是成为人民群众的
蛋氨酸(methionine,Met)作为动物的必需氨基酸,其添加剂产品被广泛应用于畜禽饲料。目前,市场上有多种来源蛋氨酸产品,但不同来源蛋氨酸的生物学效价不同且部分来源蛋氨酸在
随着我国新兴能源的大规模开发利用,抽水蓄能水泵水轮发电机已成为现代水电站建设的主要机型之一,并且逐渐向高水头、大容量、高转速方向发展。但由于水泵水轮机具有高转速、