场景与目标关系约束的鲁棒目标检测算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:pzl_530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的热点研究课题之一,在日常生活中具有广泛的应用前景。近年来,基于区域的目标检测已成为相关研究的主流方向,然而这类方法受限于复杂的现实场景。为了实现精准且鲁棒的目标检测,本文以场景与目标上下文为约束,研究了上下文信息在目标检测任务中的建模方式,在对典型算法对比分析的基础上,从有监督和无监督两个方面分别提出了对应的鲁棒目标检测算法。本文的主要工作包括:(1)提出了一种场景与目标上下文的通用建模框架。在对有监督和无监督目标检测主流算法进行对比分析的基础上,总结提出了适用目标检测任务的场景与目标上下文的通用建模框架。在此建模框架下,PASCAL VOC数据集上的实验验证了上下文关系对有监督目标检测模型的有效性,另外Cityscape to Foggy Cityscape数据集上的迁移实验也验证了上下文关系在无监督检测中的有效性,证明了在所提通用建模框架下设计目标检测模型以提高检测性能的可行性。(2)提出了一种基于图推理的残差联合注意力网络(Residual Joint Attention Network with Graph Inference,RJANet)。所提RJANet利用联合注意力机制引导网络分别从空间和通道维度选择性地调整特征,然后将目标检测问题转化为图推理问题,在场景与目标上下文的联合约束下完成推理,以得到更加鲁棒的候选区域特征。PASCAL VOC数据集上的实验结果表明,与Faster R-CNN和SIN相比,所提模型的m AP分别提升了3.4%和0.7%,证明了所提目标检测模型的有效性。(3)提出了一种域自适应的关系网络(Relation Network for Domain Adaption,RNDA)。针对不同域图像,所提RNDA使用对抗损失在选择性对齐全局特征的同时严格对齐局部特征。另外为了在无监督模式下引入更多导向信息,RNDA在捕获目标的空间位置和视觉外观信息后,利用尺度点积注意力无监督地构建所需的目标关系。PASCAL VOC to Watercolor和Cityscape to Foggy Cityscape迁移实验表明,与Faster R-CNN相比,所提模型的m AP分别提高了10.8%和14.6%,与SWDA相比,所提模型的m AP也分别提高了0.6%和0.5%,证明了所提RNDA可减小不同域之间的差异性,有效实现无监督目标检测。
其他文献
耦合器是地球系统模式的关键模块,用于实现不同分量模式间的相互作用和系统集成,其基本功能包括在不同分量模式间的数据传递和在不同模式网格间的数据插值。耦合器作为地球系
咖啡因是一种黄嘌呤生物碱化合物,除了常见的茶叶和咖啡,人们还在许多其他的植物中都发现了它的存在。作为一种中枢神经兴奋剂,咖啡因通过饮料的方式少量使用时能够帮助人们暂时驱走睡意保持清醒,因此成为世界上使用最为普遍的精神类药物。但并不是所有人都可以享受到咖啡因带来的精神愉悦,部分人群使用后会出现心跳加快、肌肉震颤、多汗、失眠、焦虑和肠胃功能紊乱等副反应。近期的研究发现咖啡因的代谢产物1,3,7,9-三
随着人类对感知自身周边环境、获取自身周围信息的需求不断提高,无线传感器网络越来越多地被应用于人们工作与生活的各方面。作为当前热门的物联网技术的一种具体实现,无线传感器网络在目标位置与状态的追踪、工程项目的风险监测与报警以及系统的智能控制与节能等应用中,发挥着不可替代的作用。无线传感器网络的核心部件是传感器,网络内的传感器元件需要彼此通信保持协同工作以及实时更新状态。由于无线传感器网络通常在相对独立
4,6-二乙酰基雷锁酚是合成多种有机杂环系统的关键原料,其分子有多个活性基团(羟基和羰基),它的衍生物在有机合成、金属配位、生物活性以及制药等方面有很不错的应用前景。本
近年来,随着我国通信行业飞速发展,光通信器件也得到了快速的发展,光通信系统的组成依靠着光通信器件的支持,在光器件的封装工艺中光到光电探测器芯片的耦合起着重要作用,耦合效率的大小直接影响到光通信系统的整体性能,因此,光纤和探测器的封装成为众多行业关注的焦点,而光纤与探测器封装技术的关键在于实现光纤与探测器的低损耗耦合,确定最佳耦合距离。首先,本文利用FDTD算法分析了平面光纤和斜面光纤模场传播特性,
二氧化碳(CO2)的运输在碳捕集、储存及利用CCUS技术链中具有纽带作用,与船舶、公路及铁路相比,管道输送被认为是一种最优的输送形式,在CO2管道输送过程,放空系统确保管道系统安
煤炭资源作为我国的基础能源,我国每年采煤量约35亿万吨,回采巷道长约13000公里,煤矿事故多达80%发生在回采巷道中,维护回采巷道的安全是煤矿安全工作的重中之重,鑫安煤矿-380m水平,回采巷道围岩松散破碎、完整性较差,支护参数不合理,巷道开挖过程中,顶板严重下沉,两帮位移量大,巷道返修率高、工程量大、费用高,严重影响巷道的正常掘进和安全生产,因此,对鑫安煤矿大变形破碎回采巷道支护技术进行研究具
为加固碱渣,提高碱渣的水稳性能,采取制备地质聚合物凝胶的方式对碱渣进行了加固处理。文中充分利用了碱渣和粉煤灰两种废料,并尝试加入多种碱性激发剂,通过试验对多个平行试
并联机构是组成并联机器人系统的核心构件。串、并联机构在刚度、精度以及运动能力方面形成优势互补,由于目前串联机构的发展迅猛,为共同壮大工业机器人的发展,故有必要设计研究出综合性能更好的并联机构。汽车工业的不断发展要求汽车零件间的安装精确性与可靠性,运动能力强、承载力高且精度高的并联机构可很好地胜任这一工作。本文以一种8-SPU的冗余并联机构为研究对象,分析其运动学性能、承载性能以及精度性能,从这三个
近些年来,随着计算机和三维数据采集设备的不断发展,越来越多的行业使用三维方式来更直观的展示和分析数据,进而产生了大量的三维数据。与此同时,深度学习的研究也从图像领域逐渐转向了三维数据领域,并取得了显著的成果。基于此,如何利用深度学习框架在海量的经采集建模得到的三维数据中进行数据检索,逐渐成为了计算机视觉领域当前研究的热点。在先前对于三维点云数据检索的研究中,大多数方法对点云数据进行转化后再将其输入