人体动作识别算法研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:fafafaalex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别(Human action recognition)是机器视觉和人工智能领域一个新的研究课题,其目的是从视频中检测并识别目标的动作,使得计算机系统能理解人的动作,对场景进行语义描述。基于视频的人体动作识别,主要包含两个部分:人体运动区域检测和动作识别。人体运动区域检测就是采用运动目标检测方法,从视频中检测出人体运动的区域。动作识别指的是在人体运动区域进行特征提取,对特征进行描述,并采用合适的分类方法进行训练和分类。这两个方面都充满挑战:在人体运动区域检测方面,视频中存在背景复杂、光照变化、目标运动速度变化等情况,给人体运动区域检测带来很大的干扰;在动作识别方面,动作是由三维信息构成,常规的图像处理方法不能很好的处理,如何有效地进行特征的提取与描述以及分类器的设计都面临着困难。本文的工作主要包括以下几个方面:1.本文提出了一种新的视频冗余帧去除方法,减少了计算量,解决了视频冗余信息对动作分析造成干扰的问题。将VIBE背景建模和帧差法进行有效地结合,构造了一种新的人体运动区域检测方法,可以快速准确地检测出人体运动区域。2.在特征提取与描述方面,本文构造了一种有效的基于人体运动区域的3DHOG特征,并引入基于三维频域Gabor滤波的全局描述子特征和基于时空兴趣点的局部描述子特征。将这三种特征进行降维、词袋模型描述等处理,转化为描述能力更好的特征,联合进行人体动作识别。3.在多类别分类器设计部分,对于三种特征,设计了一个多特征融合多类别分类器,弥补了单个特征难以全面描述动作的缺点,提高了识别准确性。通过在国际基准动作识别数据库Weizmann和KTH上进行实验,对识别率和运行时间进行测试,验证了算法的性能。实验结果表明:多特征融合优于单个特征,三种特征的融合显著地提高了识别精度。
其他文献
以催化裂化汽油为原料,采用中压加氢实验装置模拟S-Zorb工艺研究催化裂化汽油临氢吸附脱硫的反应规律.使用工业吸附剂考察烯烃分子在临氢吸附脱硫过程中的反应行为,结果发现,
CaCu3Ti4O12(CCTO)材料具有介电常数高(104以上,常温、1KHz)、低温下稳定性好等特点,在电容器、存储器等电子器件方面有着非常广泛的应用前景。本文采用高纯度原料,通过传统固相
全球气候变化对降雨格局的影响下,土壤干湿交替现象在诸多生态系统中日益突出。由干湿交替引起的土壤碳、氮的短暂脉冲式释放很大程度上决定着长时间尺度温室气体释放的总量,是
牙菌斑是附着于牙齿表面由700多种微生物组成的复杂生物膜,其中口腔常驻菌与龋齿致病菌--变形链球菌(Streptococcus mutans)间存在复杂的种间竞争,其竞争结果决定牙齿的健康状
随着网络通信与多媒体技术的发展,视频监控技术逐渐步入了一个全新的数字化网络阶段,广泛运用于电信、银行、交通、电力、智能楼宇等诸多领域。嵌入式视频监控技术以嵌入式Li
本文通过对荣华二采区10
期刊
利用酒石酸、草酸和EDTA-2Na对ZSM-5分子筛进行酸处理,并采用NH3-TPD、N2吸附-脱附、XRD、SEM、IR等表征方法对催化剂结构和酸性进行表征.在酸处理前后的ZSM-5分子筛上进行甲
人脸识别是图像分析与理解、模式识别等领域富有挑战性的一个课题。本文针对人脸识别中存在的若干问题,结合三维人脸模型的特点,在基于三维模型的人脸识别以及三维人脸识别方面
无线传感器网络(Wireless Sensor Network,WSN)是一种以数据为中心的无线自组织网络(wireless ad-hoc network),能够实时感知、采集和监测各种环境或观察对象的信息。IEEE 802.
产甲烷菌是严格厌氧的原核生物,其特征是以甲烷为主要代谢产物;它们属于第三生命域--古菌域。乙酸为底物产生的甲烷贡献了约2/3的自然排放甲烷量,目前能够利用乙酸产甲烷的只有