基于多示例学习的动作检测方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:ruoxich
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的人体动作检测是智能监控、视频分析等应用领域中的关键技术。人体动作检测不仅需要识别动作的类别,还需要定位动作的起止时间。近些年,随着计算机视觉和深度学习理论的发展,人体动作检测任务已经取得了许多突破性的进展。但是,同样存在动作边界定位不准确、分类效果不佳等问题。本文针对目前该领域所存在的问题,提出了基于多示例学习的人体动作检测方法以及动作片段提议生成方法,并且实现了一个实时动作检测系统。本文具体工作如下:首先,本文提出了基于时间演化建模和多示例学习的人体动作检测方法以提升动作检测精度。该方法有效利用了动作及其上下文的时序结构,并使用深度多示例学习网络来同时训练动作分类模型和动作边界回归模型,从而更精准地定位动作的起止时间并识别动作的类别。其次,本文提出了基于多示例学习和多任务损失函数的动作片段提议生成方法以提高动作片段提议的召回率和重叠率。我们使用深度多示例学习来同时判断片段提议的动作概率和调整片段提议的边界,通过带有时序平滑约束与边界回归损失的多任务损失函数来学习网络模型,并且在后处理的过程中使用软化的非极大化抑制来更有效地抑制冗余的提议结果。最后,基于本文所提出的方法,设计并实现了一个动作检测系统。该系统可以更加方便直观地观察人体动作检测算法在选定视频上的检测结果以及检测耗时,并且通过分离前台显示模块和后台算法处理模块,可以被其他人体动作检测方法复用。
其他文献
危化品是推进工业发展的基石。由于危化品的易燃、易爆以及有毒等特性,任何与其使用相关的工业环节都会给人员和环境带来极大的风险。如何通过科学的风险管理方法,尽可能降低
随着互联网的飞速发展,网络新闻逐渐成为网络民众最为关注的信息来源。网络舆情是不可忽视的力量,它需要监控与引导。对于热门话题发现与趋势分析的研究可以及时发现社会热点
本研究以重庆某铬盐化工厂旧址铬污染土壤为研究对象,探讨了该双可渗透反应层的引入对于电动修复污染土壤中Cr(Ⅵ)的强化效果。对污染土壤的物化性质和污染特性进行分析,结果发
随着国家对海洋领域研究的逐渐深入,各国专家及学者在数值水池和实验室造波水池方面取得的成就越来越多。良好的数值模拟能为实验室水池,海洋工程和海岸工程等建造提供前期基
目的:阻塞性睡眠呼吸暂停低通气综合征(OSAHS)可以引起颈动脉内膜中层厚度(CIMT)增加和动脉弹性降低。此外,OSAHS与脂肪细胞因子如chemerin、脂联素、分泌型卷曲相关蛋白5(SF
眼底图像分析在医学诊断中具有重要作用,而眼底视网膜血管又是人体无创伤条件下唯一可以观测的血管,血管的一些生理结构变化能够表征许多疾病的发生。随着计算机技术与人工智
土壤中积聚着大量的潜在有毒金属(PTMs),对人类健康构成威胁,并被认为是有些区域发展和扩张的障碍。这就要求有简单的、适用多种不同地点的现场修复机制。本文采用纳米碳球包
微小型四旋翼飞行器由于其结构简单、操作灵活,并具有垂直起降、稳定性高的特点,可以适应复杂多变的外界环境,使得其在搜寻救援、测绘、危情监视等范畴得到了越来越广泛的应
为了加快我国警务部门警力资源分配的高效性,实现瞬时性的警务工作交接,提高我国警务工作处理的效率,本文利用了差分进化算法来优化警力资源的分配效果,结合了移动信息化技术
压缩感知是近十年来提出的新兴理论,在医学图像处理、无线传感网络、雷达、遥感图像处理、光谱分析、生物传感等领域有着广泛的应用。信号的重构是压缩感知理论中的重要部分,