基于双目的人体运动分析与识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:heroszk2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会的文明程度和人本身息息相关,从社会心理学角度上来说,人们越来越关注自身和自身所处的环境,这势必会促使人们探索一种观察模式来反映自身及周围的情况。人体运动分析与识别应运而生。人体运动分析与仿真、数字娱乐、医疗服务、图像精确定位等等,都离不开人体运动分析与识别,因而具有巨大的经济价值和社会价值。随着计算机硬件成本的不断下降,计算能力的不断提高,人体运动识别更是得到了空前的发展。在计算机视觉的研究领域中,由于它涉及到了视觉计算、机器学习、数字图像处理等多门学科,必将充满各种挑战。近几年来,人们热衷于从视频中研究分析人体的运动,主要包括简单动作的识别,比如人的姿态、表情等。分析过程中,研究方法简便,但是准确度不高,或者研究方法复杂,空间复杂度和时间复杂度高。本文提出了一种新的识别方法-基于双目的人体运动分析与识别。目前的研究表明,关于双目的研究主要集中在空间信息复原上。而本文借助双目的优势,从视差图入手,提取特征来表征相关人体运动信息。同时,为了提高识别的准确率,利用了人体运动的轮廓特征。深度特征和轮廓特征通过一定的特征融合方法组合起来,共同表征人体运动的特点。最后利用相关机器学习算法:朴素贝叶斯分类、支持向量机等,来构建一个人体运动识别模型。本文所做的主要工作如下:(1)从实现场合和所应用的技术方面,研究和分析了视差图,总结比较了一些当今流行的视差图生成技术。主要涉及到了三种立体匹配算法的分析:块匹配算法(BM),半全局匹配算法(SGBM)和图割匹配算法(GC)。通过比较这三者的匹配效果和执行速度,折中选择SGBM来作为本系统的立体匹配算法。(2)在特征提取上,重点对视差图进行了处理。在某些情况下,生成的视差图灰度分布不均匀,本文采取直方图均衡化的方法来处理。使灰度均匀分布。同时经过均衡化处理后,以该视差图的灰度直方图作为它的特征,也能很好的表征该人体动作。(3)基于视差图的特征提取后,选用目前比较流行的机器学习算法-支持向量机,来建立识别模型。构建模型的过程中,用到了LIBSVM软件包,快速方便的解决人体动作识别分类问题。同时还确定了线性、多项式、径向基和S形函数四种常用的核函数的选择。
其他文献
随着信息处理技术与测绘技术的快速发展,数字矢量地图在地理信息系统、数字化城市和智能交通运输系统得到了广泛应用。数字矢量地图具有易编辑易传播的优点,极大方便了人们的日
布局问题(Packing问题),其研究背景包括印刷电路板(PCB)布局方案设计,航天器舱的布局方案设计,工厂机床摆放问题等。求解这些问题不仅要求待布物能放置在尽可能小的空间内,而且
作为计算机视觉研究领域里最热门和最有前景的识别任务之一,视频中识别人类活动的任务在过去的许多年来引起了研究人员的极大关注。不仅仅是因为这是一个人工视觉系统的基本能
20世纪90年代以来,互联网技术快速发展,网页页面样式也越发多样。现时的网页中,充斥着大量的导航、广告等与页面主体内容无关的信息,这些信息和网页的主体信息混杂在一起,大大增加
人脸标定技术是计算机视觉领域识别人脸几何结构的一门技术,它在人脸处理系统中扮演着重要的角色。后期人脸处理的很多任务,比如人脸识别、人脸姿态估计、人脸表情分析等,都
无线传感器网络是一种自适应很强的自组织网络,大量廉价的节点密集部署在监测区域,时刻监测着环境参数的变化,为人类提供很多关于环境的实时数据。如果说因特网改变了人类之
随着科技的发展以及信息时代的到来,不管是购物,还是科学技术,都离不开计算机。但是现在计算机网络上的信息越来越多,对数据的保护反而没有那么重视,所以信息安全必然成为了全社会
计算机硬件技术和软件功能的提升为分布式软件在嵌入式领域的应用提供了广泛的支持。然而在嵌入式分布式软件的开发和调试中存在着分布式软件运行的“不确定性”,难以同时对多
近年来,多类标分类问题成为学术研究的一个热点,多类标分类技术是解决多类标分类和类标排序两大任务的重要技术手段,为了更有效地解决多类标文本分类问题,一种新的基于聚类树的多
随着光学、摄影等技术的不断发展,图像日益成为人们日常生活中不可或缺的部分。与此同时,新兴的图像处理技术尤其是数字图像处理技术不断涌现。作为数字图像处理的一个分支,文本