面向自然场景的监控视频语义深度学习解译方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:asd137889706
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
监控视频中包含了各种目标,具有海量的复杂信息。其中难点在于如何让机器识别出这些目标并且理解发生的事件,从而帮助我们进行高效的城市管理。计算机视觉在监控视频语义分析中具有广泛的应用价值,包括智能安防、智能交通、智能园区和智能机器人等具体场景。同时随着深度学习的突破性进展,近年来的研究大多都以深度学习为基础进行展开,而本工作也基于深度学习首先对语义分割进行了研究,为多种下游任务提供基础的识别分割能力,接着以人为中心对行人重识别、社会关系识别和人物交互检测三个具体的任务展开了研究,主要创新点包括:(1)针对语义分割边界模糊问题提出了区域感知神经网络(Region-Aware Network,RANet)。该网络在经典语义分割算法框架上提出了区域感知分支,在语义分割训练过程中引入了区域特征学习。其中关键在于所提算法设计了一种区域感知损失函数和一种基于记忆库的学习模式,可以在增加较少计算资源的情况下有效地利用整个数据集中的图像,从而在有监督学习下同时优化区域特征和语义分割特征的学习。(2)针对语义分割中的知识蒸馏问题提出了统一知识蒸馏网络(Unified Knowledge Distillation Network,UKDN)。该网络在基于响应的知识上提出了基于特征和关系的知识蒸馏,在浅层特征和深层特征中分别提取纹理知识和语义知识,在网络前向中提取特征变化信息。其中关键在于所提算法针对语义分割任务提取了两种新的知识进行蒸馏操作,对于浅层和深层特征中的纹理、语义和关系知识的提取可以更有效的解决语义分割任务。(3)针对行人重识别经典算法框架中的问题提出了特征空间重缩放(Spatial Re-scaling,SpaRs)网络。该网络在基线网络的基础上添加了空间重缩放层,并结合深度监督技术完善浅层特征和深层特征学习。其中关键在于空间重缩放层有效的解决了全局平均池化操作导致的特征激活区域过于集中的问题,使得网络模型学习到更加全面的特征,同时在反向传播过程中帮助网络模型稳定了梯度。(4)针对行人重识别结果排序中的问题提出了上下文感知图卷积网络(Context-Aware Graph Convolution Network,CAGCN)。该网络以基线网络为特征提取器,加入了图卷积网络对查询图像和图库图像的特征进行优化学习。在图卷积阶段通过困难图库样本采样方法充分挖掘了困难样本,并将查询图像和图库图像特征作为图节点进行构图,利用图卷积网络学习了整个数据集中的上下文信息。其中关键在于该算法以有监督学习的方式保证了困难样本挖掘的可靠性,同时在网络训练阶段完成重排优化操作极大的缩短了后处理时间,提高了整体算法的效率。(5)针对真实世界中的社会关系识别问题研究构建了一个基于监控场景的社会关系视频数据集,提出了时空关系图卷积网络(Spatial-Temporal Relation Graph Convolutional Network,STRGCN)。其中数据集是该领域首个包含现实生活场景的数据集,同时算法框架填补了社会关系识别在真实世界中研究的空白。该框架以多模态特征为输入,通过一种行人行为和特性分析方法进行建模,充分挖掘了多模态特征在时间维度中的信息。接着通过两种图卷积网络进行社会关系特征学习,从而完成社会关系识别。其中关键在于算法基于构建的数据集对多人关系进行了多模态特征学习和建模,能够一次性输出整个场景中的每对人之间的关系。(6)针对人物交互检测经典算法框架中的问题提出了交互性提议图神经网络(Interactiveness Proposal Graph Network,IPGN)。该网络包含了经典算法中的三分支网络和一个图分支网络。其中提出的图分支网络包括一个全连通图和一个稀疏连通图,分别用于学习第一阶段的交互性知识和第二阶段的交互动作知识,而由全连通图建模的交互性特征将同时用于两个阶段的特征学习。其中关键在于该算法通过两阶段的设计流程为全连通图提供了一种更简单的学习目标,可以构建一个更明确可靠的图来建模交互性特征,同时交互性特征又将进一步用于稀疏连通图中的交互动作特征建模,有利于动作分类。
其他文献
期刊
引信电子升压与起爆相比传统的机械起爆方式,具有高精度、稳定性强、安全可靠等优点,能够满足现代军事和民用领域的需求,具有广泛的应用前景。本文从电路设计和安全控制角度出发,对设计的电路和程序加以仿真与试验验证,完成了引信电子升压与起爆的研究设计。首先根据对常用开关电源结构及特性的分析,确定以反激拓扑结构作为升压主电路,在此基础上详细研究反激式变换电路的工作原理;分析升压解除保险安全控制理论后,确定了解
学位
互联网+的思维出现,带来了经济形态的演变,产生了许多新兴产业,互联网金融业出现极大地改变了人们的生活方式,增加了社会投资渠道,惠及了社会大众尤其是处于弱势地位的个体及融资难的小微企业。在2005年发源于英国的网络借贷平台带来了网络借贷业的发展,短短的十二年间网络借贷业在全球得到了快速发展,网络借贷已经成为大众一种流行的投资方式,也成为小微企业及被正规金融排除在外的个体主要融资渠道,也产生了大批服务
学位
在经济持续快速发展的大环境下,作为“美丽经济”的化妆品行业得到了蓬勃发展,目前,我国已成为全球第二大化妆品消费市场。与此同时,消费者的消费理念不断升级,添加植物类原料的产品在化妆品市场迅速崛起,顺应了人们既要美丽又要健康的消费心理。2021年1月1日,《化妆品监督管理条例》(以下称新《条例》)正式施行,为植物类化妆品原料的开发和利用提供了政策支撑,并注入了新活力。但是绿色、天然不等于健康、安全,文
期刊
<正>职称是体现专业技术人员学术、技术水平和专业能力的重要标志。职称评审是进行专业技术人才管理的指挥棒,是企业进行评价工作的有效手段。职称制度是专业技术人才评价和管理的基本制度,对凝聚专业技术人才,激励专业技术人才发展,加强专业技术人才队伍建设都具有重要意义。本文通过总结我国职称体系发展历史的各个重要阶段以及在不同时期职称工作的状况,剖析职称工作中目前存在的问题,以期了解职称体系变革过程、明晰现状
期刊
“双碳目标”背景下,纯氧在能源领域的需求与日俱增。混合导体透氧膜作为一种同时具有氧离子和电子混合传导性能的无机致密陶瓷膜,可从空气中高选择性地分离纯氧而备受关注。然而,透氧膜的稳定性与氧渗透通量之间的权衡一直是制约其工业化应用的瓶颈问题。由氧离子传导(IC)的萤石材料和混合离子电子传导(MIEC)的钙钛矿材料组成的IC-MIEC型双相透氧膜,相对于单相钙钛矿型透氧膜,在CO2等恶劣氛围下显示出优越
学位
爆破作为大规模、高效益的破岩方法,在隧道工程中广泛应用,但不可避免地给邻近建构筑物和围岩带来一些不良影响,其中以爆破振动为首。电子雷管起爆延时精确、安全可靠,可以实现对爆破振动强度与频谱的主动控制,是降低爆破地震效应的有效手段。为探究电子起爆条件下雷管位置和数量对爆破振动频谱的影响,通过现场试验和数值计算相结合的方法,归纳总结了起爆点分别位于靠近装药段底部、装药段顶部、装药段中部、装药段顶部底部同
期刊
高压电路是引信电子安全与起爆系统的重要部分,主要实现将弹上控制系统提供的28V电压提升至1200V以上的起爆电压。本设计以引信电子安全与起爆系统高压变换电路的现有技术为背景,基于GJB373B-2019《引信安全性设计准则》和GJB6456-2008《引信电子安全与解除保险装置设计准则》要求,对高压变换电路进行分析设计。首先,分析了国内外电子安全系统的研究现状以及高压变换技术的研究现状,确定了高压
学位
期刊
期刊