基于多特征融合的行人再识别方法研究

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:softzheng1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和通讯技术的发展,传统汽车与人工智能结合的无人驾驶汽车也受到越来越多人的关注和研究。无人驾驶也称自动驾驶,面临着很多挑战,其中最为重要的就是安全问题。由于自动驾驶是无人驾驶,没有人为操控,通过电脑对路况信息的判断最后做出行车决定。因此,自动驾驶对行车安全的要求更高,而人车系统中行人的安全又是至关重要的。在自动驾驶中,行人识别、行人再识别和行人行为预测是人车系统安全的重要组成部分,并对自动驾驶的发展有着重要意义。行人是人车系统安全的重点观察对象和目标,因而对视频中行人检索、再识别、跟踪及行为分析成为人车系统安全的重要组成部分与关键技术。本文围绕图片、视频行人再识别以及行人行为预测三个问题开展了相关的研究工作,安排工作如下:(1)针对图片的行人再识别,本文提出了一种新的生物度量学习方法—基于人体骨骼相互学习的行人再识别(HSMLP-Reid)。人体骨骼互学习人再识别的目的主要是利用本文提出的结合全局骨架信息的新的行人局部分割方法来解决背景影响和局部姿态变化的影响。首先利用自底向上的方法估计行人的姿态和骨架,并在此过程中标记出行人的交接点。为了解决背景对行人再识别的影响,本文提出了一种新的局部分割方法—关节点分割法来对行人进行局部分割并进行局部块匹配。此外,通过自底向上的方法从行人二维骨架估计中定义关节距离来学习全局骨架信息,并进行全局骨架匹配。最后,为了提高模型的性能,本文使用基于生物特征识别的局部匹配和整体骨骼匹配进行互学习,分别训练分类损失和度量损失。(2)针对视频行人再识别,本文建立了一个三重金字塔模型来学习动作信息,用于基于视频的人的再识别。首先,将从三层金字塔模型中提取的动作信息集成到外观信息中。其次,利用三维卷积神经网络对融合后得到的融合特征进行处理,实现对人的再识别。三重金字塔模型将RGB图像分成R、G、B三个部分,然后将三重金字塔模型提取的三个部分的动作信息进行整合,得到完整的动作信息。在融合Ⅰ阶段,本文融合R,G,B行动信息成一个完整的人的运动信息。融合Ⅱ阶段,将行动作变化信息融合到外观信息,在操作处理信息时,可以补充整体的外观信息。并用三维卷积代替传统的二维卷积。本文还改进了三元组损失训练参数的方法,将三元组损失训练应用于视频行人再识别,更新网络参数。视频三重损失不仅包括视频间测量距离损失和视频内测量距离损失的总和,还包括视频间和视频内的动作信息损失和视频间和视频内的外观信息损失。通过与MARS、i LIDS-VID、PRID-2011三个视频行人数据集的准确率对比,验证了基于RGB三重金字塔模型的视频人再识别的良好性能。(3)针对行人行为预测,本文提出一种新的行人行为预测方法—基于网格划分骨骼的行为预测方法。该方法主要分为两个部分,首先使用自下而上的方法提取出行人的骨骼信息,规定左右肘、左右手、左右膝以及左右脚8个关节点作为提取行为习惯的关节点,并且通过学习8个关节点的距离度量特征和角度度量特征提取出行人的行为特征。对8个关节点分别对比前后帧的行为特征,判断出下一帧单个关节点运动类型的概率,通过对下一帧8个关节点运动类型的加权判断出下一帧行人的动作。为了更好的评估行人下一帧的动作,本文通过对行人进行网格划分并提取相应关节点的划分网格特征。对比前后帧的划分网格特征,判断出行人的运动方向以及运动速度。本文对基于图片、视频的行人再识别中存在的问题以及行为预测中存在的问题提出了相应的解决方案与算法模型,并通过大量的实验验证了这些算法的有效性。本文的研究成果将会推动无人驾驶、人车系统安全的进一步发展。
其他文献
幾基化合物(carbonyl compounds)是大气光化学反应过程中的重要中间产物,既是光化学烟雾的重要组成成分,也是光化学烟雾形成的重要前体物。随着长三角地区经济快速发展,以臭
话题突出是汉语的特点,研究话题句对进一步了解汉语这一语言的特征有着重要的意义,对外国学习者学习汉语也有着重大的帮助。本文通过收集整理老挝留学生书面语和口语中的语料,考察学习者在汉语式话题句和汉语话题句非典型现象中的偏误情况。第一章阐述了本文的选题缘由、研究意义、研究方法和语料来源,并梳理了前人的研究成果。第二章主要研究老挝留学生汉语式话题句的偏误,老挝留学生在汉语特殊句式中出现偏误最多的句式是句式
偶像崇拜作为一种在社会中普遍流行的现象,已经在社会生活的各个领域广泛渗透了,对我国现今社会产生了潜移默化的影响。同时,也对人们的价值取向、思想观念和行为方式产生了
冲刷腐蚀普遍存在于油气田开发过程,也是长期困扰油气生产的一个主要问题。原油集输管道由于输送介质中含有流沙等固体颗粒,容易对输送管道内壁造成冲刷腐蚀。本文对原油集输
困境儿童救助保障问题仍是当今社会的热点问题,为了保护这些民族和国家的希望,我国已经建立了复合型困境儿童关怀基金,社会暖心团体也逐渐开展了“海洋天堂行动”(帮助自闭症等特殊疾病的困境儿童)、“旱地甘霖行动”(资助重灾区域儿童饮用干净的水)、“温暖包行动”(救助寒冬中被人遗弃的儿童)等救助特殊的儿童群体和弱势群体的暖心行动。即便如此,困境儿童的身心健康仍然得不到充分保障,且困境儿童的数量仍然很庞大,所
《笠翁对韵》是清代出现的一本韵对类蒙学读物,自清代以来,盛行不衰。本文以《笠翁对韵》为研究对象,对其作者、版本源流和流传情况进行考订,并对其中的音韵、属对、格律、诗
研究目的:脑卒中是我国成年人致死、致残的首位病因,具有发病率高、致残率高、死亡率高和复发率高的特点。目前脑卒中的损伤机制十分复杂,多种因素参与其中,而针刺效应主要通过抑制神经细胞凋亡和促进神经可塑性两方面实现,现阶段缺乏针刺干预促进神经可塑性的效应机制研究,且信号通路尚不明确。本研究基于cAMP/PKA-pCREB信号通路,探讨针刺“百会、内关、三阴交”对脑缺血大鼠神经功能的治疗作用及神经可塑性恢
在市场快速变化、经济高速发展的当下,企业竞争非常激烈。企业纷纷开始选择并购方式实现产业升级、寻求可持续发展。然而,很多企业在并购之后,企业的绩效并没有到达预期效果,甚至走向了衰败。因此,合理的判断并购是否提升了企业的经营效果,成为企业值得关注的问题。根据以往的文献可以看出,国内外学者在并购绩效评价时重点关注在财务方面。而平衡计分卡作为一个通过财务、客户、内部流程、学习与成长四维指标的评价体系,结合
长江上游山区河流谷地多呈V或U形,河床比降陡,水流能量大,河床多处于冲刷下切状态。在河床侵蚀下切和汛期暴雨作用下容易产生崩塌、滑坡和泥石流等自然灾害。其中河床结构是
近年来,全国各地纷纷展开了大大小小戏剧活动并且形式也越来越丰富,其中最具有代表性的就是戏剧节的举办。南京戏剧节的举办在不断推动南京地区戏剧艺术发展的同时,也逐渐成