视觉目标跟踪和识别的理论与方法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wtuye262626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息采集、存储、传输、处理和显示等技术的飞速发展,视频信息处理和分析也成为从视频中获取有用信息的重要手段。视觉目标跟踪与识别既是计算机视觉等领域的重要研究课题,也是视频监控和人机交互中的关键技术。  尽管目标跟踪和识别技术经过几十年的研究有了很大的进展,但挑战依然存在。在实际应用中,尤其是在复杂情况下,如目标自身的运动、姿态及外界环境如光照、干扰、遮挡等各种变化,现有的目标跟踪和识别技术仍不能满足实际应用的要求。因此,研究适合特定目标和适应各种复杂情况的目标跟踪与识别的理论和方法仍然具有重要的学术意义和应用价值。  本论文主要研究目标自身和外界环境的复杂变化下的跟踪和识别问题。在目标跟踪方面,主要以人脸、车辆和行人等作为跟踪对象,利用子空间、特征点和协方差特征等目标表示的方法,对机动目标跟踪、在线模型学习、多姿态跟踪、人脸器官联合跟踪以及提高复杂情况下目标跟踪的鲁棒性进行了较深入的研究。在目标识别方面,研究了在光照和姿态等复杂变化情况下基于视频的人脸识别和动态纹理识别。  本论文的主要研究工作及创新点包括:  基于目标外观子空间表示的跟踪方面,  提出了一种结合特征点和子空间表示的机动目标跟踪方法。通过匹配相邻两帧间的SURF特征点建立自适应运动模型,并利用自适应粒子滤波跟踪目标。该方法提高了跟踪效率以及跟踪快速运动目标的性能。  提出了一种基于Grassmann流形的在线子空间更新方法。利用子空间序列在时间上的关联,在Grassmann流形的切空间上应用Kalman滤波,并利用流形上的测地线与切向量的关系更新子空间。该方法能得到较稳定的子空间表示,在复杂情况下能实现更稳定的目标跟踪。  提出了一种基于切换多线性子空间模型及Rao-Blackwellized粒子滤波的多姿态人脸跟踪方法。对于每一个姿态的人脸用一个线性子空间表示,并用一个Markov模型实现多个子空间模型的切换。该方法能有效跟踪多姿态人脸,并且可以在跟踪的同时估计人脸的姿态。  提出了一种脸部器官(眼睛、鼻子、嘴)联合跟踪方法。利用MRF表示人脸器官之间的相互关系,并结合粒子滤波和信度传播实现跟踪模型在时间和空间上的推理,从而实现人脸器官联合跟踪。在眨眼和说话时眼睛和嘴部出现明显变化的情况下,联合跟踪具有比独立跟踪脸部器官更好的性能。  提出了用加权多模态协方差表示目标的跟踪方法。通过核加权使接近目标区域中心的特征点具有更大的权重,并结合多个子区域的加权协方差表示目标,利用粒子滤波实现跟踪。该方法在目标受干扰和部分遮挡情况下具有鲁棒性。  提出了利用核子空间距离和核Grassman鉴别分析的人脸识别技术。在两个包含光照和姿态变化的人脸库上的实验表明核Grassmann鉴别分析具有更好的识别性能。同时,利用约束子空间提高了基于线性动态系统表示的动态纹理的识别性能。
其他文献
近地告警系统是当飞机与地面危险接近时,为避免飞机与地面相撞而给机组人员提供报警、从而增加飞机安全性的一种告警系统。近地告警曲线是是否需要报警的唯一依据,因此近地告
学位
传感器无人机将以传感器/机体共形的方式搭载跟踪雷达和对地监视雷达,并以亚声速近空间飞行器为载体,完成战场监视、目标探测与跟踪、情报收集等任务。   首先,基于信号36
学位
对高压电的监测和测量是继电保护的重要前提,也是电力维护的重要组成部分。设计安全、可靠和实时性好的高压电缆信号监测仪具有重要实际意义。非接触式测量具有安全、方便等诸多优点,已成为高压电缆测量的发展趋势。本文针对非接触式高压传感器采集得到的三相高压电缆电压信号特点,进行了后续信号处理的软件算法设计和硬件系统设计。非接触式测量的主要问题是高压电缆周围电磁感应带来的各种高频和随机噪声干扰以及比较严重的同频
混沌理论是随着现代科学技术的迅猛发展,尤其是在计算机技术的出现和普遍应用的基础上发展起来的新型交叉学科。它已成为最新型智能计算机的三大支柱之一,引起了各国学术界和工
激光多普勒测速仪是一种可以精确测量物体运动速度的速度测量仪器。它具有动态响应、空问分辨率高、测量范围大、非接触测量等优点,不但能提高带钢速度测量的精度,还能避免传
一直以来,我国煤矿事故不断,给人民生命财产造成了重大损失,与当前正提倡的和谐社会建设严重不符。因此急需建立一个全面、准确的模型来对矿井瓦斯系统进行描述。模型建好之
短期电力负荷是电力系统调度、用电、计划、规划等管理部门的重要工作之一。提高负荷预测技术水平,有利于节能,提高电力系统的经济效益和社会效益。因此负荷预测已经成为实现电力系统管理现代化的重要内容之一。本文首先论述了短期电力负荷系统的研究背景、研究现状及研究意义。结合GPRS无线数据传输和嵌入式系统的特点,采用ARM9为核心,设计了电力负荷系统的嵌入式数据采集终端,能够实时、准确的采集负荷预测所需数据,
神经网络作为一种典型的非线性动力系统,具有极其复杂的动力学特性,现已成功应用于模式识别、联想记忆、信号处理、定点计算等科学领域。然而,神经网络在电路实现的过程中,由
全球聋哑人超过7000万,手语是他们沟通的首选方式。普通人未系统学习过手语,与聋哑人的交流存在障碍。手语识别技术利用传感器和计算机将手语翻译成语音或文字,能帮助正常人理解
火灾的发生不仅给自然环境带来严重的灾害,还对人类的生命和财物造成了严重的威胁和重大的损失,然而经济的快速发展和人们各种社会活动的不断增多,给火灾的发生带来了更多的