视频中人体运动行为识别方法的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:FlyingBird173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是指利用计算机算法通过对视频中的人体行为进行分析自动识别出其类别,因被广泛应用于智能视频监控、高级人机交互、智能驾驶辅助系统、体育运动动作分析等领域,近年来成为计算机视觉领域的研究热门。由于人体运动的非刚性、背景的复杂性以及相机运动的影响等,人体行为识别成为一个极具挑战的课题。本文对视频中人体运动行为的识别方法进行了研究,具体的研究工作如下:1.稠密轨迹的人体行为识别方法是对每一帧全图像密集采样,导致特征维数高、计算量大且包含了无关的背景信息,针对上述问题提出了基于显著性检测和稠密轨迹的人体行为识别方法。该方法首先对视频帧进行多尺度静态显著性检测获取动作主体位置,并与对视频动态显著性检测的结果线性融合获取主体动作区域,通过仅在主体动作区域内提取稠密轨迹来改进原算法;然后采用Fisher Vector取代词袋模型对特征编码增强特征表达充分性;最后利用支持向量机实现人体行为识别。在KTH数据集和UCF Sports数据集上进行仿真实验,相比于稠密轨迹的人体行为识别算法,识别准确率分别提升了1.2%和0.4%。2.为充分利用人体行为的时域信息同时减少帧间冗余降低特征维数,提出了提取有效视频帧并对其时间序池化的人体行为识别方法。该方法首先对视频帧的稠密轨迹特征采用局部累计描述向量编码获取视频帧特征表示;对每帧的特征编码进行余弦相似度分析,剔除冗余特征帧得到有效视频帧特征序列;采用时间序池化对有效视频帧特征序列进行排序,得到可表示视频时序动态变化的特征向量;最后利用时间序特征向量训练支持向量机实现分类识别。在HMDB51数据集和UCF101数据集上进行仿真,识别准确率分别为65.2%和89.4%。3.针对处理视频数据过程中容易造成维数灾难的问题,提出了一种线性序列差异分析的方法对视频数据降维来进行人体行为识别。首先运用ViBe算法对视频帧进行背景减除操作获取行为区域,在该区域内提取稠密轨迹特征来去除背景数据的干扰。然后对Fisher Vector编码后的特征进行线性序列差异分析,采用动态线性规整算法计算序列类别间相似度,将特征从高维空间投影至低维空间来降低特征维数。最后利用降维后的特征训练支持向量机。在KTH数据集和UCF101数据集上进行仿真,实验结果表明该算法可有效提高识别率。
其他文献
变叶木(Codiaeum variegatum)是典型的热带园林植物,叶形多变,叶色艳丽,在热带地区各大小公园、街道、宾馆、庭院常见栽培,造形各异,品种众多.
对AVG曲线中距离、波幅、当量大小包含的信息进行了详细分析。利用AVG可以分析近场长度、未扩散区长度、测量衰减系数,确定发现缺陷大小的能力和检测范围,分析常规计算理论的
实施治未病工程,首先要明确"治未病"的基本内涵,认为"未病"的本意所指为一种特殊的状态,即"病前状态"——既非健康,也非疾病,而是从健康至疾病至疾病之间必然存在的一种中间
鲁迅的童话文学翻译是他文学翻译活动中不可分割的一部分,无论是鲁迅文学翻译的方式还是主导思想都不可避免地会影响到他童话翻译的方式和主导思想。鲁迅的童话翻译活动中,有
帮助行为“正犯化”研究是刑法理论研究中很少有人涉及的一个领域,它不属于共同犯罪理论的一个枝节,却又离不开共同犯罪的理论基础。我们都知道一般情况下,刑法理论对帮助行
<正>自市委八次全会决策上海建设科创中心以来,主流媒体刊发的有关落实这个国家战略的论文、建议、典型报道、先进人物的创造发明连续不断,难以数计。"互联网+"成了见报频率
本研究探讨id4基因启动子区甲基化状态在非霍奇金淋巴瘤(NHL)患者中的检测意义。采用甲基化特异性聚合酶链反应(MS-PCR)对正常人和初诊NHL患者骨髓进行id4基因启动子区甲基化
陈寅俗虽无研究《红楼梦》的专文,但在其他论著中,特别是在《柳如是别传》、《论再生缘》等红妆研究论著中却反复提及《红楼梦》。他关于《红楼梦》的论述大致有两个方面:一是在
全球化在促进技术、产品、资本和劳动力等因素在世界范围高度传播与流动的同时,也就21世纪的世界政治提出了一系列问题:国家主权会丧失殆尽吗?民族国家的世界体系会消亡吗?未
目的探讨早发型重度子痫前期以及保守治疗对早产儿预后的影响。方法对2001年1月至2006年5月于北京大学第三医院产科分娩、孕周<34周的早发型重度子痫前期患者76例(研究组)活