基于视频的人体行为识别的理论与方法研究

来源 :电子科技大学 | 被引量 : 11次 | 上传用户:wolfcner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视频的人体行为识别是计算机视觉技术的一个热门研究领域,在智能监控、行为分析、视频检索和人机交互等领域具有较为广泛的应用前景。目前行为识别的应用仅限于手势识别和一些简单的肢体识别,真正大规模成熟应用依旧任重道远。本文主要从传统机器学习和深度学习两大方面对人体行为识别进行研究,主要内容如下:1.密集轨迹算法框架下的新型特征描述子组合。密集轨迹能够有效捕获复杂的运动信息,密集轨迹算法在行为识别领域取得了较好的识别效果。我们在密集轨迹算法框架下引进三维梯度直方图(3-Dimension Histogram of Oriented Gradient,3DHOG),这是梯度直方图(Histogram of Oriented Gradient,HOG)特征在时空立方体上的三维扩展,并与光流直方图(Histograms of Optical Flow,HOF)特征以及运动边界直方图(Motion Boundary Histogram,MBH)特征融合,在融合特征作用下的识别结果相比于原本HOG+HOF+MBH组合方式,识别率得到一定的提升。2.基于Fisher正则约束项的低秩稀疏编码方式。低秩稀疏编码是一种有效字典编码方式,其编码具有稀疏性、局部一致性和空间连续性,我们在其基础上引入Fisher正则约束,使得编码保持原来优点的同时,通过“减少类内散度,提高类间散度”,进一步增强编码向量的判别能力。3.为克服深度网络模型在轻量人体行为数据集上识别率不佳的问题,引入三维卷积深度特征和人工特征融合的行为描述子。三维卷积网络的深度特征能够与人工的3DHOG+HOF+MBH特征组合形成有力互补,进一步提高描述子对人体行为的语义描述能力。4.三维卷积神经网络和双流卷积神经网络的融合。三维卷积神经网络和双流卷积神经网络是行为识别领域两个经典的深度学习模型,两者的融合能够在一定程度上增强特征的时空特性,提升模型对样本的判别能力。
其他文献
信号交叉口处车辆折算系数取值是否合理直接影响到信号交叉口计算通行能力的精确与否。以往的研究认为直行过程、左转过程和右转过程的车辆折算系数相同,忽略了车型和车辆运
为确保体外诊断试剂在流通环节等方面符合要求,保障临床试剂的质量,该院按照GSP、《医疗器械经营质量管理规范》《医疗器械冷链(运输、贮存)管理指南》等对医疗器械的贮存与
近年来我国房地产价格持续走高,商业银行的信贷规模呈扩张趋势,房地产信贷风险逐渐凸显。本文通过对1998年到2013年房地产价格指标和商业银行信贷余额数据进行计量分析建模和
目的探讨C2下关节突螺钉的手术技术和临床经验。方法回顾性分析20例用C2下关节螺钉代替C2椎弓根螺钉与C1侧块螺钉连棒固定患者的临床资料。对其术后影像及临床JOA评分进行评
蒲松龄的《聊斋志异》塑造了众多花妖狐魅的形象,其中最为人们熟悉和喜爱的当属婴宁。婴宁爱花成癖,敢说敢笑,天真烂漫,亦憨亦黠,具有真性情。蒲松龄塑造婴宁这个形象是对妇
在全局静态环境下,提出了一种适用于窄通道环境路径规划的蚁群算法。解决了传统蚁群算法容易陷入局部最优解、易于造成蚂蚁迷失等不足。一方面,在灰度矩阵上随机撒点并将障碍
为深入研究气体绝缘开关设备(GIS)的隔离开关分合空载短母线产生的特快速暂态过电压(VFTO),建立了252kV GIS试验回路并研制了VFTO、特快速暂态电流(VFTC)和开距测量系统。该
20世纪,社会发展节奏越来越快,家长越来越忙,导致很多孩子从小学开始进入住宿学校,长期缺乏家人的关爱,社会间亲情越来越淡薄,小孩子的各种问题层出不穷。面对如此严峻的形势
通过比较青藏高原东部高寒草甸植物群落的地上生物量、物种丰富度及其相关关系对两种放牧方式和4种施肥梯度的响应,分析了放牧方式和施肥梯度对该类草甸群落的影响。结果表明