论文部分内容阅读
计算机视觉作为一个新兴的学科领域,近来发展十分迅速,作为视频分析和理解的关键技术,基于视频的行为识别被广泛应用于机器人导航、视频监控系统、智能交通及游戏娱乐等行业。相对于图像而言,视频的表现形式更加直观,且其信息更加丰富,因而在当前多媒体迅速推广的背景下得到广泛应用。然而,多媒体发展导致了大量数据的产生,如何有效的对现实视频进行识别分类成为视频处理领域的研究热点。近年来,研究人员在相关领域虽取得一定的成就,但行为识别的推广及应用还面临着诸多问题,在对国内外人体行为识别相关研究进行分析总结的基础上作了下述工作:首先,本文对国内外行为识别领域研究现状进行总结,并分析现有行为识别方法存在的问题,研究视频多种特征,针对三维梯度方向直方图(3D Histogram ofOriented Gradients,3DHOG)特征数据量过大、表达力不足的缺点,提出一种新的结合稠密光流的视频特征提取方法,根据稠密光流得到特征点空时轨迹,在轨迹点处提取3DHOG特征,这样3DHOG特征在以跟踪轨迹点为中心的立方体内提取,使得特征具有一定空时不变性,特征描述力更强,同时避免了与目标运动无关的信息对识别的干扰。其次,针对光流直方图(Histograms of Optical Flow, HOF)特征对摄像头运动敏感的缺点,提出三维光流梯度方向直方图(3D Histogram of Optical Flow Gradients,3DHOFG)特征提取方法,提取稠密光流的梯度图像,在三维空间分块统计直方图作为视频运动特征。3DHOFG特征对光流求取梯度用以表示视频中运动的改变,在摄像头运动的情况下,由于多数情况下摄像头运动较为平缓,使得该特征对摄像头运动具有一定的鲁棒性。再次,针对视频运动特征不带有静止背景图像特征的缺点,本文提出结合使用视频运动特征和静止图像特征的分类框架,选取视频关键帧后,对关键帧图像提取SIFT特征和颜色直方图特征,用以表示视频的静态特征。本文框架融合运动特征和静态特征,对现有视频库进行分类测试,取得较好的结果。最后,总结了本论文的主要研究内容,给出了今后的研究方向。