人体骨架序列深度特征建模与行为识别研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:nihaoalinlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术、信息技术和传感器技术的快速发展,图像、视频、图等数据日益增长,并广泛存在于计算机视觉和机器学习等领域。这些数据蕴含了丰富的信息,挖掘其有用信息,对视频检测、视频跟踪和行为识别等领域具有重要的理论和实用价值。随着深度学习等数据驱动技术的发展,卷积神经网络和图卷积网络等深度模型能够有效挖掘数据的辨别性特征,具有模型与数据匹配度高等优点,是数据分析的有效手段。作为计算机视觉的重要课题之一,人体行为识别在安全检测、视频监控以及区域安防等领域具有广泛的应用,其方法主要包括基于视频序列的行为识别和基于人体骨架序列的行为识别等。其中,人体骨架序列是典型的图数据,对其进行有效建模可为图数据分析提供良好的基础。传统方法通常基于预提取特征,构建分类器对其识别,这致使模型与数据匹配度低,且对复杂行为缺乏有效的特征建模方法。如何对人体骨架序列特征进行有效建模,以挖掘其有用信息是人体骨架行为识别需要解决的关键科学和技术问题,具有重要的理论意义和应用价值。本文以模式识别理论和深度学习技术为基础,重点研究利用图卷积网络对人体骨架序列的深度特征建模时存在的一些问题,提出了相应的解决方法。论文的主要研究内容和成果如下:1.针对人体骨架序列深度特征建模中,因关节节点遮挡引起的模型鲁棒性差的问题,提出一种空间区域失活网络。该方法首先基于视频序列提取人体骨架序列,并构建空时图。然后,设计一种空间区域失活单元,可随机失活人体关节节点。最后,利用图卷积网络提取特征,进而识别行为。该方法较好地解决了人体骨架序列的深度特征建模中的关节节点遮挡问题,提高了算法的鲁棒性。2.针对因人体运动间隔变化导致人体骨架行为识别模型适应能力差的问题,提出一种变间隔时域编码网络。该方法首先设计一种变间隔时域采样单元,对人体骨架序列进行随机采样。然后,利用图卷积网络对采样获得的骨架序列提取特征。该方法能够模拟实际场景中的行为变速情形,可有效提高模型的识别性能,同时,也较好地解决了图数据模型过拟合问题。3.针对因骨架序列的视角变化导致的人体骨架序列行为识别模型识别性能降低的问题,提出一种多视角变换网络。该方法通过构建多视角变换单元对人体骨架序列进行视角变换,并利用图卷积网络对其输出进行编码,有效提高了模型的识别性能,增强了模型的泛化能力。本文研究成果为利用图卷积网络对人体骨架序列深度特征建模与行为识别提供了新思路和新方法,为图数据的深度特征挖掘提供了技术支撑。
其他文献
共轭1,3-丁二炔是一类重要的有机化合物,主要通过端基炔的Glaser自偶联反应合成,即以铜盐、碱助剂或配体组成的热催化体系。鉴于多相催化剂易分离、可重复使用等优点,近年来负载型铜催化剂用于热催化合成1,3-丁二炔成为研究重点。由于纳米铜颗粒(CuNPs)具有可见光诱导的局域表面等离子体共振(LSPR)效应,负载型纳米铜催化剂逐渐被用于光催化合成领域,但由于CuNPs易被氧化和流失等问题,目前未见
微悬臂梁是MEMS器件中最基本也是最典型的微结构,常用于微传感器。微悬臂梁具有灵敏度高、体积小、成本低等优点,在微小粒子及细胞检测等微生化领域受到了越来越多的关注。本文以内嵌沟道式微悬臂梁传感器为研究对象,根据内嵌沟道式的两种工作模式,理论分析并数值仿真微悬臂梁在不同工作模式下受不同载荷时的弯曲挠度变化和共振频率变化。通过检测微悬臂梁的振动频率的偏移,可以定量地分析计算微流体的质量,进而得到微流体
随着医药行业的快速发展,我国药品研发、生产、流通、使用领域的安全问题越来越突出,2018年吉林发生的长春长生疫苗事件便是突出反映药品安全问题的重大事件。究其原因,既有药品行业自身的问题,也与国家监管不力密不可分。为充分保障广大民众的身体健康和生命安全,必须加大药品生产经营企业的社会责任,加强对药品行业的监管。药品安全监管是一项系统工程,需要全社会共同参与。相对其它监管而言,行政监管具有独特地位和作
本文研究了 m(m≥2)台并行机、带有公共交付期的最大化(权重)加工收益调度问题。该问题被认为是NP-hard,也就是说,除非P=NP,否则无法在多项式时间内找到一个精确算法来求解该问题。并行机是指系统内具有多台速度相同的处理机,每个工件只需在任意一台机器上加工即可;公共交付期是指所有工件具有相同的交付期;加工收益是指工件在交付期之前所完成的工作量。本文研究了该调度问题无权重和带权重模型,并分别提
中小微企业的数量不断增长,已成为推动我国经济发展的重要力量。然而融资难一直是困扰中小微企业发展的一大问题。随着2005年商业性小额贷款机构开始出现以来,小额信贷行业得到了飞快的发展,为我国金融市场注入了新的活力,为中小微企业第一时间提供资金支持,扩大了企业融资的渠道。然而,小额贷款企业作为新型的金融机构,并未获得法律层面明确的金融地位,不断发展的同时也面临着诸多的风险。所以,在当今经济一体化进程不
时域有限差分法(FDTD,Finite Difference Time Domain)是一种常用的电磁计算数值方法,它将目标空间划分成数量非常多的网格块,利用蛙跳式算法对空间内的电磁场进行交替迭代计算。FDTD计算方法的特殊性使得它拥有直观易懂、可并行性高、应用性广泛等特点,因此它被应用到计算电磁学的各个工程领域中,随着计算机硬件尤其是图形处理器(GPU,Graphics Processing U
受口译即时性的限制,口译员在进行英汉同声传译时需要尽快地输出。在此压力下,口译员容易受源语约束,从而影响译文质量。法国释意学派理论提出的“脱离源语语言外壳”的方法,
《汉语学习》(Studies in the Chinese Language),是由旧中国海关总税务司署汉文秘书科汉语学习股中外职员集体编写、海关造册处1931年出版,供海关外籍职员汉语学习与考试的统编系列教材。该书共三册,其中A、B册为海关工作商务公文,C册为海关工作生活口语交际。本文从二语学习的角度,以《汉语学习》为研究对象,对该书的成书背景、体例、选材、词汇、口语以及商务教学等方面进行分析,
深度学习给物体的识别和检测带去了重大进展,但它们的本质只是将视觉信息和有限的语言符号进行关联。本文将它们的目标向更广义的智能推进一步,通过视觉信息和任意语言描述的关联,使得智能体能像人类一样理解对物体的指示说明,从而能在视觉感知图像中,唯一定位出符合语言指令的目标区域,这个任务叫做视觉依据。本任务的输入为图像和文本,输出为目标物体的占据区域,属于视觉和语言的交叉领域。由于认知功能的复杂性,本文采用
命名数据网络(Named Data Networking,NDN)作为未来互联网的代表性架构,因其基于名字的路由以及网内缓存机制,使得IP网络中针对主机的分布式拒绝服务(Distributed Denial of Service,DDoS)攻击方式失效。然而NDN的请求-应答通信模式及有状态的转发却滋生了新的DDoS攻击方式——兴趣泛洪攻击(Interest Flooding Attack,IFA