一种融合多特征描述子的行为识别方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lmtc5238
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉作为一个新兴的学科领域,近来发展十分迅速,作为视频分析和理解的关键技术,基于视频的行为识别被广泛应用于机器人导航、视频监控系统、智能交通及游戏娱乐等行业。相对于图像而言,视频的表现形式更加直观,且其信息更加丰富,因而在当前多媒体迅速推广的背景下得到广泛应用。然而,多媒体发展导致了大量数据的产生,如何有效的对现实视频进行识别分类成为视频处理领域的研究热点。近年来,研究人员在相关领域虽取得一定的成就,但行为识别的推广及应用还面临着诸多问题,在对国内外人体行为识别相关研究进行分析总结的基础上作了下述工作:首先,本文对国内外行为识别领域研究现状进行总结,并分析现有行为识别方法存在的问题,研究视频多种特征,针对三维梯度方向直方图(3D Histogram ofOriented Gradients,3DHOG)特征数据量过大、表达力不足的缺点,提出一种新的结合稠密光流的视频特征提取方法,根据稠密光流得到特征点空时轨迹,在轨迹点处提取3DHOG特征,这样3DHOG特征在以跟踪轨迹点为中心的立方体内提取,使得特征具有一定空时不变性,特征描述力更强,同时避免了与目标运动无关的信息对识别的干扰。其次,针对光流直方图(Histograms of Optical Flow, HOF)特征对摄像头运动敏感的缺点,提出三维光流梯度方向直方图(3D Histogram of Optical Flow Gradients,3DHOFG)特征提取方法,提取稠密光流的梯度图像,在三维空间分块统计直方图作为视频运动特征。3DHOFG特征对光流求取梯度用以表示视频中运动的改变,在摄像头运动的情况下,由于多数情况下摄像头运动较为平缓,使得该特征对摄像头运动具有一定的鲁棒性。再次,针对视频运动特征不带有静止背景图像特征的缺点,本文提出结合使用视频运动特征和静止图像特征的分类框架,选取视频关键帧后,对关键帧图像提取SIFT特征和颜色直方图特征,用以表示视频的静态特征。本文框架融合运动特征和静态特征,对现有视频库进行分类测试,取得较好的结果。最后,总结了本论文的主要研究内容,给出了今后的研究方向。
其他文献
在经济不断向前发展,市场愈加白热化的竞争环境中,上市公司对资本结构和会计盈余之间的关系越来越关注,发现二者之间有某种关联,而且希望通过将会计的盈余质量进行调整,来实
文章以AT89C51单片机点亮LED为例,研究如何使用仿真软件Proteus进行仿真。仿真软件Proteus在单片机的设计、应用领域具有很大的辅助作用,可以仿真8051、PIA、AVR、ARM等多种
目的 探讨老年中晚期口腔肿瘤切除患者生活质量的影响因素。方法 选取本院收治的老年中晚期口腔肿瘤切除患者73例,采用调查问卷调查患者一般资料,并采用癌症患者生活质量核心
颅鼻部软骨肉瘤一例李国建姚庆端王全贵患者女,13岁,因1年前鼻部外伤后,右眼视力下降,鼻部隆起,双眼球外突,逐渐加重。于1994年7月12日入院。患者偶有眼痛、头晕,无剧烈头痛、发热、恶心、呕吐
以层序地层学理论为指导 ,充分利用地震、钻井资料 ,分析了潜江凹陷潜江组不同级次的层序界面识别标志 ,建立了地震、钻井层序划分标准 ,并对潜江组三级层序进行划分和对比 ,
本文对房地产投资的主要风险进行了分析研究,同时针对房地产投资风险提出了相应的防范策略,从而提高房地产投资的经济效益。
文章探讨了在"一带一路"建设背景下,语言互通所起的作用,并提出汉语国际教育专业在这一背景下体现出的国际性特征,文章论述了汉语国际教育专业实施双语教学的重要性,并根据"
<正> 《文苑英华》是宋太宗雍熙三年成书的一部官修诗文总集,保存了许多唐以前的诗文资料,其中有一些作家作品,目前已经散佚,因此,这部书可以作为校勘、辑佚、考订的重要依据
<正>中国有着悠久的历史和广阔的疆域,但在近代,内忧外患接踵而至,大片国土陷于敌手,令当时身怀家国之情的学者多有感慨:"吾人处于今世,深感外侮之凌逼,国力之衰弱,不惟汉、
<正>2009年我有幸与学校领导和其他老师远赴山东学习观摩山东的杜郎口中学、兖州一中、昌乐二中的高效课堂。回校后我们也参照山东模式开展了合作课堂。高效课堂和传统课堂明