基于时空域卷积的行为识别研究与实现

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:hongsx14
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别是计算机视觉中一个重要的研究方向,是视频监控等领域的关键技术,具有极大的研究价值。在图像领域,卷积神经网络已经被证明具有强大的学习能力。然而,由于人体行为的高复杂性与多变性,3维卷积神经网络应用于视频人体行为识别仍存在时序特征损失、运动特征难提取等诸多问题。因此,本文将3维卷积神经网络的连接方式、结构等多方面进行改进,并对改进后算法的实现和应用进行了研究和分析。(1)针对3维卷积神经网络将视频的时域和空域同等处理所导致的视频时序特征损失的问题。本文设计了一种单源输入的视频行为识别模型,该模型改进了3维卷积神经网络时间维度的连接方式,使得当前时间的神经元只与过去时间的神经元建立连接,从而保留前后图像之间的因果性,避免了视频时序特征的损失。同时通过构建顶层特征图金字塔,实现只用一个特征提取网络获取视频的多尺度时间特征,减少了额外的计算成本。并且在每个时间尺度都添加了一个非局部的激励结构,使得模型能够自动关注于关键的时间尺度的信息,从而获得更具有判别性的时空特征。实验结果表明,该模型能够达到较高的识别准确率,并且模型能够充分挖掘视频的时间特征。(2)针对数据集中部分行为类别不需要通过运动特征即可区分开来所导致的模型偏向于利用物体和场景信息判断出行为类别的问题。本文设计了一种多源输入的视频行为识别模型,该模型将RGB图像序列和光流图序列的信息进行融合,由于光流图能够更好地表征人体的运动特征,避免物体和场景的影响,融合后的模型对于行为的识别分类具有更强的鲁棒性和泛化性。同时添加未来帧预测的分支网络,通过子任务来约束特征提取网络充分挖掘视频中的运动特征,进而提升主任务行为分类的准确率。实验结果表明,该模型能够达到较高的识别准确率,并且因为分支网络的存在,模型能够有效地提取到人体的运动特征。
其他文献
根据实验数据,尝试建立明确的数学模型,然后利用该模型解释变量之间的关联,分析数据的变化规律,一直是科学家的重点工作之一。以线性回归、支撑向量机和神经网络为代表的传统统计分析和机器学习方法,虽然能够分析数据之间的变化规律,但是由于其模型缺乏解释性,科学家很难对实际数据做出物理规律解释。符号回归方法通过组合数学或物理表达式,来自动构建能够拟合数据的模型,为科学家解释数据规律提供支撑。目前符号回归大多数
学位
梁章钜(1775-1849),福建长乐人,清乾隆、嘉庆、道光时期著名的书法家、文学家、诗人、金石书画鉴藏家。清代中期,随着金石学的兴起与朴学的发展,书坛上有着碑帖并行的时代特点。清代晚期是碑学从金石学中脱离出来走向成熟的时期,有金石碑刻考证热潮之遗风。在此背景下,本文以梁章钜的金石书法题跋为中心,结合其诗文、书法作品及相关资料,对梁章钜金石书法交游、题跋著作、碑帖思想及书法实践进行探讨。认为:一、
学位
随着现代深亚微米工艺的发展,电路器件的特征尺寸持续缩小,电路集成度越来越高,电子电路的规模急剧增长,电路仿真技术正逐步成为集成电路设计者必不可少的重要验证工具,其收敛性能与收敛效率已成为整个设计流程中至关重要的一环。在众多电路仿真模式中,求解静态工作点的直流分析是最为基础也是最为重要的任务之一。伪瞬态分析(Pseudo transient analysis,PTA)算法是当前直流分析寻找电路静态工
学位
叙事性舞蹈作为舞蹈艺术的重要组成部分,在舞蹈的叙事结构上,大多采用起承转合的结构方式,面对复杂多变的叙事情节,虽发展出了时空交错式结构、非线性叙事结构等结构方式,但在叙事舞蹈的创作中如何具体的使用以上结构并未有过多深入的探究。因此,本文以笔者学位专场汇报剧目——原创小舞剧《俞大猷》的创作实践为研究内容,以分叙的叙述方法为切入点,结合叙事性舞蹈的研究现状,探究分叙在叙事性舞蹈中构建叙事结构的可行性,
学位
设计模式可以使软件开发者能够高质量地复用以往代码的解决方案,可以使开发者的开发效率大幅提高、开发质量大幅提升,并使软件更具有可读性、开发工作更标准化。然而,软件中一般会存在原始程序文档缺失、不准确,缺少从设计模式角度的描述信息,同时,以往的设计模式识别方案还不同程度地存在适用于大型软件的能力弱、分类区分度不高和过拟合等问题。因此,为了更方便地理解软件的设计思路,从软件源代码中将设计模式实例准确快速
学位
现代地质构造工程中,地质信息大多以二维图件资料形式呈现,工程施工人员难以直观、全面地把握所研究的地质体对象,在工程设计与施工过程中遇到了诸多不便与困难。同时,随着信息技术的日新月异,计算机技术与传统石油地质研究领域的结合成为了大势所趋。许多新式工程项目,例如智能导钻、油水界面预测等应用对三维地质建模提出了更高的要求。因此研究出一种完备的三维地质建模方法具有重要意义。传统三维地质建模方法通常是把各项
学位
白沙茅龙笔自明代陈献章创制至今流传已有五百余年的历史,作为国家级非物质文化遗产项目,其具有艺术价值、审美价值、历史文化价值以及环保价值,成为岭南重要的文化标志。明前中期理学家、教育家、诗人、画家、书法家陈献章晚年喜束茅为笔,首创了茅龙笔和茅龙书法。其身后又有不少门人弟子及明清、民国一批书家为岭南地区茅龙笔书法的传播、发展作出重要贡献。白沙遗风延续至今,茅龙笔书法也成为岭南书坛一种独特的现象长期存在
学位
清代书法家梁巘《评书帖》云:“晋尚韵,唐尚法,宋尚意,元、明尚态。”“尚态”书风起源于元代,其始创者赵孟頫追崇晋韵唐法掀起复古思潮,进而形成的一种追求字形体态的书风现象,此书风贯穿于元朝,并延续、影响了整个明代书坛。本文试从明代“尚态”书风的表现形态及发展的多种视角下进行探究,以期塑造一个多维度的明代“尚态”书风。第一章从明代“尚态”书风的表现形态及发展来进行阐释。主要分为三部分:一是将明代“尚态
学位
传播学作为一种研究方法和手段,将之和其他学科交叉假借,形成一种新的研究角度。书法作为一门艺术,具有传播媒介的功能,书法领域的一切活动,书写、展览、观赏等都可以视为一种传播活动。书法传播,是书法学和传播学二者的交叉范围,通过此方向的研究能够让我们对书法产生一种全新的认识。书法如何融入当代的艺术传播中一直被学者们所探讨,近些年越来越多的学者借助传播学的角度研究书法的变化与发展,但以传播要素的角度的研究
学位
清代碑学的渐起与兴盛并不是无源之水,源于当时学术界对金石学、文字学的关注。而清代学术的发达也与清代幕府的兴盛以及学人游幕密不可分。毕沅幕府作为清代重要的学人幕府之一,无论在规模上还是影响上都不容忽视。毕沅幕府所处的时期也非常特殊,其上承朱筠幕府,有了足够的汉学积淀,又与阮元幕府有着千丝万缕的联系,且由于毕沅的关系,幕府内聚集了一批在学术和艺术颇有影响力的群体。毕沅幕府治学以史学、文字学、金石学、地
学位