基于深度学习的时序动作检测研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:anlanyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着网络带宽的迅速增长、存储技术的进步以及各种视频录制设备的普及,人们已身处一个视频数据爆炸性增长的时代。面对海量的视频数据,依靠人力来对视频进行分类、识别和分析等操作并不现实。而人是当今社会生活的主导者,视频中大部分有价值的片段都与人体行为息息相关,基于人工智能的时序动作识别的重要性日益凸显,其已广泛应用于智能安防、老弱人群的监护、机器人研究等多个领域。如何分析处理如此海量视频数据,挖掘其中包含的信息和蕴藏的价值变得尤其重要。比起传统机器学习算法,深度学习的最大优点是提供了一种端对端的训练方法以自主学习数据特征,并用于分类识别。深度学习方法也因此在人工智能领域取得了诸多突破性的进展。因此,将深度学习技术应用于时序动作检测中,可以大幅提升视频中人体行为的理解和识别模型的性能表现,具有极大的研究价值。本文以深度学习方法为基础,设计了多种区段提议网络结构以获取更加优质的时序片段提议。采取多尺度特征融合策略,在动作特征之上,添加上下文信息和全局信息,并利用反卷积层进行特征增强,以使网络的时序边界回归和动作分类更加精确。此外,提出时序边界修剪模块作为通用的后处理模块,对网络检测到的动作时序边界进行精确修剪。并将所提出方案在THUMOS-2014数据集上进行了实验仿真。相较于近年的研究成果,所提出模型在该数据集上获得了目前的最高精度,mAP@0.5达到了53.3%。并且具有较高的召回率和较低的平均提议数,整体性能得到了大幅提升。此外,本文所提出的时序边界修剪后处理模块,对多个现有网络模型的时序定位预测结果进行了修剪,仿真结果显示所提出模块不同程度地提升了原有网络的精度,证明了所提出模块的有效性和通用性。
其他文献
加快推进白货物流营销是铁路货运开拓社会物流市场的有力抓手,为进一步提升铁路白货物流市场营销水平,针对当前铁路白货物流市场营销现状及存在的组织架构不合理、人员配备不
钾和氮是植物生长发育所必需的矿质营养元素。在农作物生产中,钾和氮的供给水平直接影响农作物的产量和品质。然而,我国耕地土壤普遍缺钾和氮,农作物生产中需大量施用钾肥和
白云凹陷是珠江口盆地已证实的富生烃凹陷,主力生烃层系恩平组的勘探前景亟待深入研究。受持续的构造沉降影响,白云凹陷恩平组构造圈闭匮乏,但构造、沉积条件均有利于岩性地
最近三十年来,中国参政党建设研究已取得重要进展,但与执政的中国共产党的建设已形成完备的理论体系相比,参政党建设研究显得比较落后,且严重滞后于参政党建设实践的创新发展
现在随着城市化进程的发展,城市内人口数量越来也多,并且不断有人口和产业向中心城区内迁移,与此同时道路拓宽、旧城改造等各项工作都在有序地开展,城市正在发生着日新月异的
目的探讨七氟醚麻醉诱导时应用右美托咪定对患者躁动及应激反应的影响。方法在我院2015年10月—2016年9月期间诊治的全麻手术患者中抽取78例随机分组,研究组(n=39)在七氟醚麻醉
<正> 东风汽车(集团)公司(原第二汽车制造厂)的审计工作,贯彻转变观念、积极发展、强化监督、提高效益的方针,以加强思想政治工作,搞好精神文明建设,在以财务审计为基础,以内
说起好朋友的典范,我们的脑海立刻涌现俞伯牙与钟子期,廉颇与蔺相如……,如果此时有人提出--庄周与惠施,你可能很纠结!他们是朋友吗?不是吗?
研究背景神经胶质瘤是起源于神经外胚层的中枢神经系统最常见的原发肿瘤。WHO分级Ⅰ~Ⅳ级,级别越高其恶性程度越高。由于神经胶质瘤存在恶性增殖和侵袭强的特点,因此预后不乐
化学需氧量(COD)和总氮(TN)减排是“十三五”废水处理提标的重要内容,电化学法基于阳极氧化和阴极还原反应,可有效减少外排尾水中COD和TN的含量,而电化学反应过程中的因素控制是