序列图像中的人的检测、跟踪、动作识别的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:lxy850628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究视频图像中人的检测和跟踪以及人的动作识别。人的检测、跟踪和动作识别既是当前计算机视觉和人工智能领域研究的热点也是难点之一。热点在于它的应用前景非常广泛,无论是在视频监控、人机交互还是在视频检索等领域,都具有很大的应用潜力。难点在于人的动作种类非常多,动作特征变化大,容易受环境影响等。本论文借鉴了目前应用于动作识别的主流技术,如特征点、支持向量机、Mean-Shift等,提出了改进的方法,并通过实验证明论文提出的方法在识别的准确性和鲁棒性方面有所提高。论文的主要创新点概述如下:   ⑴提出了一种自然光条件下的颜色模型,并结合模板、图模型和贝叶斯方法提出了一种行人的检测方法。基于颜色分析,提出的颜色模型能够较好的适应光照和角度的变化。利用行人的特点进行模板检测,提高了算法的效率。由于对象随时间变化,可能改变尺度大小,又提出了一种结合二个参考节点的图模型来检测对象的位置和大小。   ⑵改进了mean shift方法,提出一种基于模板的结构化的核函数的人的跟踪方法。mean shift在很多的实验研究中被证明能有效的跟踪目标,它的问题在于跟踪窗口的大小难于确定,易受环境的影响,并且在目标尺度变换的情况下,有可能会失效。本文根据跟踪目标的特点,把目标分成几个部分,每个部分有自己的特征,每个部分相互之间具有空间结构关系,这样就可以有多个具有空间位置关系的核函数分别跟踪目标的每个部分。同时设计了一个简洁有效的算法,使得在分别跟踪目标的不同部分时相互约束,从而提高了跟踪精度,实验表明其跟踪的精度要优于原有mean shift方法。   ⑶提出一种结合轮廓特征和DTW来识别人的动作方法。DTW最初应用于信号处理领域,并在语音识别中也发挥了重要作用,但在应用于动作识别时,需要解决如何求得不同序列中对应节点距离的问题。由于人的动作序列是一组由前后次序关系的动作姿态构成的序列,而轮廓信息能够较好的抓住不同动作的姿态,且DTW能够比较具有先后时间关系的序列的相似度,所以提出一种结合轮廓信息和DTW得到序列之间的距离,并用最近邻法识别不同的动作类型,此外还实现了一个高效的轮廓匹配方法。实验证明所提方法能够在较短时间内检测出不同的动作类型。   ⑷提出一种SVM-SMM人的动作识别方法,该方法利用半马尔科夫(SMM)为动作序列建立模型,并用支持向量机(SVM)通过训练得到模型参数。这里的动作识别是指对一个包含不同动作类型的连续的动作序列的识别,因此该动作识别的本质也是一个动作分割问题,即在一个动作序列中,根据不同的动作分割成序列段,并分别加以识别。SMM的优点在于它能够为段以及段与段之间的关系建立模型,而该模型的参数是通过广义SVM方法学习得到。实验表明所提出的SVM-SMM方法要优于HMM-SVM和SVM方法。   ⑸在DTW和编辑距离(edit distance)基础上,提出了一种弹性序列关联方法(ESC)来进行动作的分割和识别,并进而把该方法应用于视频中动作的检索。实验表明该方法不仅提高了识别率,而且提高了搜索效率。   ⑹在特征点的基础上,利用不同的特征描述提高识别率。在复杂环境下,动作识别的准确性通常不高,这是由于目标特征容易受环境影响。而特征点具有一定的鲁棒性。论文分别在二维和三维空间中,通过不同的检测方法得到特征点,并结合SIFT和形状上下文(shape context)方法给出了特征描述,在此基础上又提出利用码词(codeword)作为更上一层的特征描述。实验证明特征点在提高目标识别的准确性方面具有重要作用。
其他文献
9月17日-19日,2020第七届中国营养保健食品产业销售商大会在广州举办.挪威Neptune Pharma As(海王星制药)中国区事务负责人Cindy Chen女士在接受本刊专访时表示,海王星正在加
期刊
在古诗词的教学中,教师讲解汉字独特的字形、字理,能帮助学生展开想象、体验情感,走进感性的语言世界。首先,教师可以寻找汉字在诗与画间的逻辑关联,让学生在品读古诗的时候,
在数字图像处理领域,图像噪声的滤除一直是最重要、最基本的研究课题之一。由高斯噪声和脉冲噪声叠加而成的混合噪声是数字图像中存在的一种典型噪声。而传统方法对于这种类型
口语交际能力是中职生必备的语文综合能力之一,而汽车营销的工作岗位和职业特点决定了中职汽车营销专业学生必须具备较强的口语交际能力.在中职口语交际教学中,教师可以采用
在旅游管理教学中开展中职学生职业养成教育既是旅游业发展的需要,也是学生成才的需要。中职教师不能改变家长对中职教育根深蒂固的观念,但可以改变教学方法,让中职学生热爱
随着能源危机的加剧,绿色高效的照明系统得到了人们的广泛重视。我国在1996年也推出了“中国绿色照明工程”,旨在我国发展和推广高效照明器具,逐步替代传统的低效照明电光源,节约
10月18日,第三届“微康益生菌杯”酸奶DIY创新竞赛在华中农业大学直播厅顺利举行.rn此次竞赛是由微康益生菌第三次冠名举办,湖北省食品科学技术学会、环境食品学教育部重点实
期刊
倒立摆系统是一个典型的单输入多输出、非线性、强耦合和自然不稳定的系统,对这样一个复杂系统的研究,理论上将涉及系统控制中的很多关键问题,比如非线性问题、鲁棒性问题、镇定
半导体制造过程是世界上最复杂的制造过程之一,具有可重入、大规模、混合加工方式、多产品、不确定性等特点,这给建模和调度带来了很大的困难。本文主要探索半导体制造过程新的
课堂是动态的、生成的,常常伴随着许多无法预测的事件。在课堂教学中,教师要抓住“生成性教学”这一动态教学过程,耐心启发学生寻找问题的线索,引发学生自觉发现问题的本质,