基于并行注意力机制的地面红外目标检测方法

来源 :红外与激光工程 | 被引量 : 0次 | 上传用户:wafh000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地面背景下的红外目标检测是伪装防护、精确制导等领域的关键技术,针对现有基于深度学习的目标检测模型对地面背景下红外目标进行检测时容易受到复杂背景干扰,对目标关注不足,从而导致检测准确率不高的问题,本文提出了一种基于并行注意力机制的地面红外目标检测方法。首先,利用卷积和注意力并行的下采样方式,在降低模型的空间复杂度和提升训练速度的同时,对目标特征进行聚焦和关注;其次,对主干网络提取的多尺度特征进行融合,通过不同尺度信息的复用与互补抑制背景信息的干扰,提升目标检测的准确率;最后,利用焦点损失函数和CIOU
其他文献
电力线分割对于实现无人机自动避障、保障无人机低空飞行安全具有重要意义。传统基于线和线段的算法只能在一些简单场景下应用,在复杂场景下极容易出现误检、漏检情况。近年来深度学习的快速发展极大的促进了电力线分割研究,但是相关研究仍然存在三个问题:1)较少考虑实际应用2)没有充分利用电力线特点3)忽略了缺乏大规模电力线数据的问题。基于电力线分割的实际应用需求,本文改进了传统的F1-Score评价指标,提出了
期刊
深度神经网络在图像分类领域具有突出表现,但易受到对抗样本攻击。为提高图像分类神经网络的鲁棒性,提出一种基于k-WTA的对抗样本防御模型Att-k-DefGAN。模型在Rob-GAN的基础上做出改进,并利用k-WTA激活函数的不连续性与模型训练中的对抗攻击预处理形成对抗,进一步提高分类神经网络的鲁棒性。实验结果表明,在CIFAR-10数据集和ImageNet子集上,Att-k-DefGAN训练得到的
期刊
本文提出一种改进的红外多类别多目标实时跟踪网络,在确保跟踪精度的同时,重新设计无锚框网络结构,进一步降低网络的参数量与推理时间。通过优化目标特征向量,进一步提高识别精度,同时简化与改进跟踪流程。此外,通过细化分析相关流程执行时间,选用GPU与CPU分别执行最优运算,提升跟踪整体运行速度。上述方法被应用于低空海面红外目标跟踪数据集中。结果表明,在本文所提的综合评价指标下,所设计的网络相较其它轻量级网
期刊
为了明确鱼鳞坑措施下降雨后土壤水分再分布过程及范围的变化,以汇流面积2 m~2,径流系数0.3为试验条件,选取规格为60 cm×40 cm×10 cm(长×宽×深)的鱼鳞坑,通过灌水试验研究了降雨强度分别为60,30 mm/h、历时1 h后连续7 d的土壤水分动态。结果表明:(1)降雨强度60,30 mm/h时灌水后第1天水分入渗深度为60,50 cm,第2天达到最大值,分别为80,60 cm,水
期刊
针对地面场景下的红外目标检测易受复杂背景干扰,检测精度不高,易发生误检和漏检的问题,本文以车辆红外特征为研究对象,提出了基于全局感知机制的红外目标检测方法。在以Darknet-53为主干网络的基础上,结合具有全局信息融合的空间金字塔池化机制,在增大模型感受域的同时增强了模型的全局信息感知力和抗干扰能力;设计了平滑焦点损失函数,解决了图像内因目标相互影响而导致的检测精度不高、易出现误检、漏检等问题。
期刊
图像文本跨模态匹配是计算机视觉与自然语言处理交叉领域的一项重要任务,然而传统的图像文本跨模态匹配方法要么只考虑到全局图像与全局文本匹配,要么只考虑到局部图像与局部文本匹配,无法全面有效的考虑局部和全局信息,导致提取出来的特征信息不完善。或者只是简单的对全局图像与全局文本特征进行提取,局部细节信息无法凸显,导致全局特征无法充分表达其全局语义信息。针对该问题,本文提出一种基于堆叠交叉注意力的图像文本跨
期刊
传统的基于深度卷积神经网络(CNN)的滚动轴承故障诊断方法,存在梯度扩散、参数爆炸、小样本泛化能力弱和训练时间长等缺点,主成分分析网络(PCAnet)相比CNN网络结构大大简化,无需反向传播,一定程度上解决了上述问题。而PCAnet本质上还是将图像转化为向量进行特征提取,忽略了多维图像的空间结构关系和内在信息,MPCAnet能从多维空间中提取图像的高级语义特征,提升了处理张量对象时的分类精度。由于
期刊
实际应用中的卫星调度方案往往受到外界因素的影响,例如电磁干扰、卫星失效、云层遮挡以及新任务的动态到达等.需要在短时间内对原始调度方案进行调整并生成新的调度方案,以保证卫星系统的稳定性,因此研究卫星应急调度方法具有现实意义和研究价值.本研究考虑了新任务到达情况下的卫星应急调度,建立了多星协同应急调度的整数规划模型,并提出了一种基于动态邻域结构的卫星应急调度算法(Satellite Emergency
期刊
神经心理测试可以对各认知域受损严重程度做出客观评价,是检测疾病进展、评估药物疗效的有效手段。其中理解力测试部分通过判断受试者是否根据指令要求做出相应动作实现,是老年人认知功能障碍评估的重要部分,有利于痴呆的早预防早干预。提出了一套神经心理测试中理解力检测的人体姿态估计视频分析方法,基于Openpose深度卷积网络提取人体关键点坐标,然后基于图像形态学处理技术和Faster R-CNN等技术提出了纸
期刊
随着三维测量技术的成熟,非接触式3D掌纹采集系统为掌纹识别的研究提供了新的途径。为了提高3D掌纹信息的采集精度,本文提出一种融合双目立体视觉与结构光的便携式非接触3D掌纹采集系统。首先将编码图案投影到目标手掌表面,使用双目相机获取左右视图后,采用格雷码结合相移的方法获取目标的绝对相位信息,然后引入基于波义尔摩尔投票算法进行最大概率校正来降低视差图中的跳变噪声,经过亚像素级立体匹配和双目相机的立体标
期刊