基于一致性约束和乱序无关性的行为识别方法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:qiuyujie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的人体行为识别是计算机视觉中一项非常重要的任务,其在人机交互、智能视频监控、康复医疗等领域发挥着重要的作用。随着深度学习的崛起,大量基于深度学习的方法应用于行为识别领域,并取得了不错的效果。但是现实生活中场景更加复杂,如何对数据进行有效处理并提取具有判别力的特征仍然是目前行为识别领域尚未完全解决的问题。因此,本文主要从增强特征学习的完整性和判别性两个方面展开深入的研究:1)提出了基于一致性约束的视频级人体行为识别方法。大多数人体行为识别方法都是通过从视频中采样的片段进行特征学习,而采样的视频片段往往只包含行为的部分内容,以至于学习到的行为特征不够完整。针对该问题,本文将整个视频对应的片段集合作为模型输入,设计了基于视频级的网络训练方法。在此方法中,定义了一致性约束损失,使得来自同一视频的片段在投票空间中的投票概率更加接近;最后建立了视频级的分类损失函数用于模型的训练。2)提出了基于乱序无关的人体行为识别方法。局部关键特征增强是提升行为识别分类精度的重要方法,现有的网络结构大多是基于全局的视频数据进行特征学习,较少有基于深度学习的工作讨论如何有针对性地增强视频中的局部关键区域特征。同时现有的数据集中也缺少行为的关键区域标注。针对这些问题,本文构建了一个由特征主干网络和三个任务分支组成的多任务模型。这三个任务为关键区域学习、对抗学习和动作分类。首先,通过区域分割和随机乱序策略增强输入数据,将增强后的数据输入到多任务网络中进行训练,并通过基于乱序无关约束的关键区域学习网络来预测各区域的重要性等级。其次,采用对抗学习来消除区域乱序后带来的噪声。最后,动作分类网络将这两个任务结合起来,共同指导特征主干网络的训练,以获得更有效的动作特征。最后,本文在行为识别公开数据集UCF101和HMDB51上对所提出方法进行了验证。实验结果表明本文所提出的方法能进一步提高行为识别的性能。
其他文献
股票和债券市场间的相关性关系到投资者的获利能力、市场的整合等,一直是资本市场上的一项重要话题。近年来,导致国内外经济政策不确定性事件频发,这种经济政策的不确定性会对投资者的投资活动发产生影响,进而导致“流向质量”现象的出现,从而对股票和债券市场间相关关系发生作用。同时,已有文献较少涉及到经济政策不确定性、利率、汇率等因素以及四个细分经济政策不确定性对股票市场和债券市场动态相关关系的影响研究。基于此
学位
2019年,时任美国总统特朗普接连实施了对华为、字节跳动、小米等中国公司的科技制裁。中美两国间的科技争端因此拉开了序幕,两国的主流报纸对该事件进行了许多报道。在两国的报道中,均包含了大量的态度资源。这些态度资源反映出该国或相关政党对这一系列事件的观点、立场和意识形态,具有一定的研究价值。本文以评价理论为理论框架,基于其中的态度子系统,对中美两国针对科技争端的新闻报道进行态度资源分析。本研究自建小型
学位
GPS(L1C,民用信号)导航技术和设备正变得越来越流行,这使我们的生活变得非常轻松。1993年以来,GPS L1C信号已经成为面向公众的开放源代码,但这些技术也可能被用于可以用来监视或攻击其他工具的无人机等飞行小工具上。这样的技术应用带来的威胁可能会上升到国家国家安全问题的层面。已有研究表明,GPS接收器很容易受到干扰和欺骗,而欺骗技术主要是“录音播放”技术。已有研究同时表明,通过不同的技术,可
学位
近年来,随着学者们对行为金融学的关注及研究加深,该学科的研究成果让人们逐渐意识到传统金融学中提出的“理性人”的假设在现实经济活动中并不总是能得到满足,公司的各个利益相关者都有可能具有非理性的心理特征,尤其是公司的管理层更容易在主观上出现错误,产生这些非理性心理特征进而影响到公司的很多决策。在这些非理性特征中,“过度自信”是在学术界里最受关注的,即一种对自己的能力和未来前景有着不切实际的乐观,并认为
学位
我国的法律服务市场初步形成于20世纪80年代中期。随着经济的快速发展,法律服务需求不断增加,法律服务人员及机构加速增长。截至2020年底,全国共有执业律师52.2万多人,其中山东执业律师超过3万人,法律服务市场竞争异常激烈。LC(济南)律师事务所简称LC(济南),作为LC体系分所之一,成立于2012年,近10年不断稳步向前发展,已成为山东省内大规模的综合性律师事务所,执业律师人员规模在济南闯入前3
学位
随着日益繁琐的医疗工作及医学成像技术的逐步成熟,计算机辅助诊断与医疗的紧密结合成为了现代医学伟大进步的里程碑。肝脏肿瘤和肋骨骨折是医生常遇见的疾病,具有高发病率、死亡率和误诊率。但是肝脏肿瘤形状多样,结构各异,肋骨骨折病灶区域目标较小,放射科医师手动标注费时费力,并在过程中易出现漏判、误判现象。因此,为了简化整体流程,提高医疗工作者的工作效率,获得高精度的结果,提出相关快速全自动分割/检测算法具有
学位
布谷鸟算法(Cuckoo Search,CS)作为一种新兴的群智能算法,目前已在各个领域得到了广泛应用,已被证明是一种有效的问题求解方法。布谷鸟算法虽然具有结构简单、控制参数少等优点,然而该算法在处理一些复杂问题时会存在过早收敛、局部搜索能力弱等问题。针对布谷鸟算法的不足,本文提出的算法对原始的布谷鸟算法变异策略进行了改进,并在标准测试函数和相关优化问题上验证了算法的有效性。本文主要研究内容如下:
学位
安全有效可共享的电子医疗病历系统是整个社会急需的,如果把区块链技术和电子医疗病历相结合就可以解决电子病历存在的共享困难、数据丢失、容易被篡改等关键问题,从而保证患者数据的安全性和隐私性。然而基于区块链技术的电子医疗病历对于系统中的执行效率有较高的要求,因此要想将此电子病历实际应用到生活当中则需要研究如何提高共识系统的共识效率。共识机制作为区块链技术的核心,整个共识系统的效率则取决于共识机制。但是现
学位
数据聚类是计算机视觉、数据挖掘、信息检索和模式识别等领域的基本无监督学习任务。为了更好地拟合非高斯数据尤其是正数据向量,并有效解决有限高斯混合模型的参数估计和模型选择困难的问题,本研究将基于逆贝塔刘维尔(Inverted Beta-Liouville,IBL)混合模型进行建模方法分析。首先,提出了一种具有Dirichlet复合多项式先验的有限IBL混合模型。在模型中,本文假设上下文混合比例服从Di
学位
随着互联网的飞速发展,微博、脸书(Facebook)等网络媒体平台已经成为反映社会舆情的重要载体。国内外网络舆情事件频发,网民发布、参与扩散(主要指转发)的信息不仅反映了网民对社会的态度和诉求,而且影响着舆论的发展。分析事件的传播趋势、预测事件的扩散过程对于维护社会安全稳定具有重要意义。已有的相关研究分析不够细致且不够深入,主要存在以下两个方面的问题:(1)采用仿真的离散数据进行传播扩散分析,与真
学位