视频人体行为识别中的特征编码

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:sangsang126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
识别视频中的人体行为在计算机视觉领域逐渐引起了广泛的关注,它的目标是自动识别出未知的视频或者图像序列中人的行为。然而,如何有效快速地识别视频中的行为仍然面临诸多挑战,例如杂乱的背景,视角的改变,动作执行者的外观多样性等等。这些挑战导致了获取干净并且有区分能力的视频表示异常困难。近年来,局部描述子聚合向量(VLAD)被提出,这是一种简单同时也很高效的特征编码方法,能够获得区分性较好的视频表示。然而,在很多情况下,动态背景或者摄像机的移动会给视频的特征提取带来很大的噪声,这种编码方式会造成两方面的问题,首先,将异常的视频描述子也编码到视频表示中使得编码速度以及编码效果受影响;其次,没有充分考虑描述子特征与视觉单词的空间分布信息。本文针对视频人体行为识别的特征编码方法进行了研究,主要贡献和创新点如下:1.系统介绍了人体行为识别研究的一般流程,针对流程的每个部分,详细介绍了涉及的理论知识。比较了常用的特征编码方法,分析了各自的优缺点。2.提出了一种改进局部描述子聚合向量的方法,即不确定的局部描述子聚合向量(UVLAD),该方法针对每个描述子特征,充分考虑了噪声以及它与视觉单词的空间分布信息,采用字典里的若干个单词来对它进行编码,或者丢弃它,提升了视频特征编码的性能。3.在KTH,Youtube和HMDB51数据集上的实验,验证了不确定的局部描述子聚合向量的有效性,同时行为识别准确率超过了现有的最好的结果。
其他文献
随着生物技术的发展,DNA计算随之产生。由于DNA计算机所具有的巨大并行性、海量存储以及低能耗等有点,将有望在某些领域弥补现有计算机的不足。DNA计算是利用DNA双螺旋结构和碱
现今随着Web信息指数化的增长,传统的基于整个Web的信息采集技术由于其采集的主题范围过于广泛,导致无法保证对信息的及时更新,并且较少考虑采集信息是否与查询主题相关,已经
Ad hoc网络也称无线自组网,是由一组带有无线通信收发装置的移动节点自组织而成的多跳网络。由于Ad hoc网络中节点的移动性、资源受限、同时充当路由器以及无网络中心等特点,
学位
近年来,随着科技学技术的飞速发展,人们的生活、工作、学习都向着现代化方向迈进。在教育领域,无论是教授方式、还是学习方式,都发生了巨大的变化。教授方式由以往的传统教师与学
当今的网络需要为用户提供更多、更快和更安全的服务。提供多样性服务需要以数据包分类为基础,数据包首先根据包头中的相关域(一般为源/目的IP地址、源/目的端口号和协议五个
近年来,世界各国先后建立了四通八达的交通运输网络,交通工具与道路建设的同步跃升,的确带来了一系列严峻的交通问题,导致了巨大的物质与经济损失。因此,仅靠修建道路与交通
随着信息化建设的不断深入,各政府部门、企事业单位都根据各自的业务需求建立各自的信任域(在同一安全策略管理范围内的域)并开发各自的应用系统。而信息化的发展使得这些单
无线传感器网络是一种基于大量具有传感功能的小型移动设备所构造的网络,主要用于收集、传播和处理传感信息。当前,由于微机电系统(MEMS)与无线网络技术的进步,使得人们能够
随着应用软件的不断丰富,信息安全面临的挑战也日益严峻。一般来说,软件安全问题大都由代码缺陷引起。因代码缺陷产生的安全漏洞,很可能被攻击者利用,进而达到窃取信息、控制