基于深度学习的红外场景目标检测

来源 :中国科学院大学(中国科学院光电技术研究所) | 被引量 : 0次 | 上传用户:qiuzhiye51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
红外成像系统以其全天时的特点而被广泛应用于智能驾驶、红外侦察、环境监测等诸多领域。随着GPU算力的提升和大型标注数据集的出现,使用深度学习的方法对红外目标检测进行研究具有重要意义。然而红外图像因其波长较长导致目标的轮廓边缘模糊,特征细节不明显,缺乏颜色信息,与可见光图像相比检测难度更大。事实上,尽管随着深度学习网络的飞速发展,红外目标检测已取得了很大进步,但仍存在以下问题:(1)现有的卷积激活结构在提取特征时缺乏灵活性,编码容量受限;(2)卷积神经网络主要对局部像素建模,未考虑全局像素之间的特征关系;(3)未充分利用红外目标相对背景存在的显著性,缺少位置信息注意力;(4)嵌入式平台部署时,网络推理速度较慢,不能达到实时检测。鉴此,本文开展了如下研究工作:(1)针对红外目标特征信息较少,普通的卷积网络结构特征提取能力欠佳等问题,本文在YOLOv3的基础上设计了Effi-YOLO网络。该网络以动态卷积激活结构灵活地根据输入特征调整卷积计算区域及权重系数,并根据计算结果采用与之适应的激活率。采用轻量高效的骨干网络进行基础特征提取,并使用具有显著性增强的感受野模块扩大模型感受野,建立新的目标位置损失函数,提升模型目标回归定位准确度。在FLIR数据集上进行测试,新模型相对基线算法YOLOv3模型大小缩减为33.3%,检测m AP提升了9.9%。(2)针对卷积神经网络只对局部像素建模,缺乏像素点之间的长程依赖信息,未充分利用显著性信息等问题,设计了DINet网络模型。DINet结合了Transformer的全局信息和卷积神经网络的局部信息,强化了特征提取和建模能力。图像输入阶段利用显著性预测网络生成了具有显著性目标信息的伪彩色图像。构建了新的感受野增强模块,在扩大模型感受野同时,增强目标区域内部显著性信息,并通过多层特征层融合结构进一步提升红外目标检测性能。在FLIR数据集上检测精度比YOLOv5-S提升5.5%;在KIAST数据集上漏检率比IATDNN+IASS低4.11%。(3)为了满足实际工程项目需要,构建了一个红外无人机数据集用于网络模型的训练与验证。选择轻量化的YOLOv5-S网络,在PC端训练好之后对TX2平台进行移植。为了进一步加快模型推理速度,在TX2上采用Tensor RT加速技术对移植的YOLOv5-S进行浮点计算优化和模型结构融合,成倍提升模型推理速度,最终推理速度达到58帧/秒,满足实时检测要求。综上,本文的研究通过高效的特征提取、自适应的动态卷积激活结构、双模态图像的特征增强有效提升了目标检测能力和红外系统的目标检测性能,在公开数据集及自建数据集上进行验证,结果表明算法相对基线算法有明显提升。
其他文献
目标跟踪作为计算机视觉中的一项关键基础任务,以其重要的基础理论价值和广泛的应用需求一直以来备受关注。由于目标在视频序列中的一系列变化,如遮挡,形变,光照变化等,使目标跟踪长期面临着巨大的挑战。为克服这些挑战,随着机器学习与人工智能的快速发展,很多结合智能技术与目标跟踪的算法被相继提出推动了目标跟踪的发展,使其日益成为研究热点。目前,在深度学习领域中,主流的跟踪算法采用孪生网络的范式,通过模板与搜索
学位
根据瑞利判据,通过光学系统的光束波长一定时,望远镜的分辨率随着系统口径的增大而提升。然而,一味地增加系统口径会带来巨额的成本压力,同时受制造技术、系统装调及有效载荷等方面因素制约,传统单孔径望远镜很难继续发展突破。合成孔径成像技术在这种背景下应运而生,通过多个分离镜面按照一定排布形式达到等效于大口径光学系统的成像能力。但是随之带来的共相误差必将是导致其高分辨成像性能受阻的关键因素之一,因此共相误差
学位
随着人类探索太空的脚步不断前进,越来越多的航天器、卫星等探测器被送入太空,星敏感器作为一种高精度空间姿态测量仪器,是航天器上必不可少的姿轨控仪器之一。随着半导体集成器件的发展,航天用器件也向着高度集成化、高速化的方向发展,导致航天器载电子设备内外电磁兼容性环境愈加复杂,再加上太空复杂电磁环境影响,星敏感器的抗外界电磁干扰和对外电磁干扰等EMC(Electromagnetic Compatibili
学位
目的 探讨股骨近端防旋髓内钉(PFNA)内固定术对老年骨质疏松性股骨粗隆间骨折患者血清Ⅰ型前胶原氨基末端前肽(PⅠNP)、Ⅰ型胶原羧基端肽β特殊序列(β-CTX)、甲状旁腺素(PTH)水平的影响。方法 以随机数字表法将2018年1月至2021年12月盐城市第三人民医院收治的60例老年骨质疏松性股骨粗隆间骨折患者分为对照组(接受人工股骨头置换术治疗)、研究组(接受PFNA内固定术治疗),各30例。两
期刊
目的 比较PFN和PFNA-2治疗骨质疏松性不稳定型股骨粗隆间骨折患者的临床疗效及预后。方法 随机选取2017年5月~2020年5月辽宁省金秋医院骨科收治的骨质疏松性不稳定型股骨粗隆间骨折患者120例作为研究对象,随机分为PFN组和PFNA-2组,每组各60例。PFN组给予PFN内固定治疗,PFNA-2组给予PFNA-2内固定治疗,比较两组患者的围术期指标、并发症、髋功能、骨代谢指标和远期随访情况
期刊
红外成像传感器具有探测距离远,可穿透烟雾及可昼夜工作等优点,但红外图像体现物体细节信息的能力较弱;可见光图像分辨率较高,包含丰富的纹理细节信息,但是易受到光照等天气条件的影响,两种图像具有良好的互补特性,对二者进行综合分析可提供更详细的图像目标信息。而在综合分析这两种图像前,需进行稳定可靠的图像配准,已有的红外与可见光图像配准方法对分辨率差异大、图像较模糊和低图像质量等复杂场景下的图像数据配准性能
学位
目的:观察燥湿健脾汤联合炔雌醇环丙孕酮片治疗痰湿型多囊卵巢综合征(PCOS)的临床疗效。方法:选择60例痰湿型PCOS患者,以随机数字表法分为中药组与西药组各30例。西药组给予炔雌醇环丙孕酮片治疗,中药组给予燥湿健脾汤联合炔雌醇环丙孕酮片治疗,2组均以1个月经周期为1个疗程,连续治疗3个疗程,并随访3个月。比较2组临床疗效、中医证候评分、血清性激素[卵泡刺激素(FSH)、黄体生成素(LH)]水平及
期刊
本文基于技术演进的视角,梳理并分析数字时代新闻受众的行为逻辑与文化角色的变迁过程,以及介入性在新闻专业文化中的兴起。研究认为,数字媒体的互动类可供性为新闻受众的行为提供了介入性的逻辑,使之经历了从主动受众到情感公众的转型过程;伴随着受众的“觉醒”,观念和实践层面的介入性成为数字新闻业的核心专业文化属性;介入性专业文化赋予了新闻业新的社会角色,使之成为专业意识形态、个人情感经验、集体文化记忆,以及种
期刊
X射线聚焦镜是大型同步辐射光束线中用于光束整形与聚焦的重要光学元件,为实现X射线的高相干传输和纳米级聚焦,要求X射线反射镜的面形精度优于1 nm。超高精度X射线镜面形检测是高精度纳米聚焦镜制造和加工过程中的重要技术难题。拼接干涉检测技术是目前X射线光学元件精加工阶段的重要面形检测手段。在X射线镜的拼接干涉检测过程中,定位误差和拼接角累积误差是影响拼接面形精度的重要因素,目前国内外拼接检测装置对于定
学位
激光通信由于具有速率高、功耗低、保密性强等优点,被广泛用于空间通信领域,这也使得空间激光通信技术成为空间探索中一项重要技术。粗指向机构作为空间激光通信中实现粗跟踪的主要装置,是保证空间光通信链路建立的必要机构,直接决定了激光通信的质量。由于空间环境存在较大扰动,而自抗扰控制器作为从PID控制器发展而来的一种先进控制技术,具有较强抗扰能力的同时,继承了PID控制不依赖模型的优点,因此本课题采用自抗扰
学位