基于多模态图像融合的目标识别算法研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户：zhangfalun

【摘要】

：

【作者】

：

刘珂琪

【机构】

：

西安工业大学

【出处】

：

西安工业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着现代社会迅速发展,信息呈现出多样化、复杂化的特点,目标识别技术作为计算机视觉领域的一个重要研究方向受到越来越多的重视,在智能驾驶、视频监控、遥感等诸多领域得到极大发展和应用。其中,在智能驾驶方面,由于城市道路环境的复杂性,有效识别行人目标是保障智能驾驶安全性的重要一环。传统的行人目标识别方法仅利用可见光单模态图像特征完成,导致目标识别在全天候条件下目标识别性能低下。由于红外模态与可见光模态之间具有互补特性,目前提出了以多模态图像融合为思想的目标识别算法。但现有算法存在未考虑不同光照条件、不同模态之间的差异性等问题,因此,如何有效的结合这两种模态之间的特征信息,提高目标的识别准确率,已成为当前研究的热点与重点。本文主要针对可见光模态与红外模态两种不同模态进行基于多模态图像融合的目标识别算法研究,主要研究内容如下:针对单一模态下的行人目标识别算法在全天候场景下识别性能较差、现有的多模态图像融合方法仅在某一阶段进行融合导致其他阶段特征浪费的问题,提出了一种基于多模态多阶段图像融合的行人目标识别算法。该算法以SSD算法作为基本的检测识别框架,并将其扩展到双流,采用直接堆叠的融合策略对两种模态特征进行融合,比较与分析单阶段和多阶段两种不同特征融合方式。通过实验证明,多阶段特征融合方式为最佳的融合方式。另外,多模态行人目标识别性能与单模态条件下相比更具优势。针对现有基于多模态图像融合的目标识别未考虑到不同光照条件下不同模态对融合特征的生成所占比例不相同的问题,提出了一种基于光照感知权重融合的多模态行人目标识别算法。该算法先将可见光特征与红外特征经过ECA注意力机制模块,以增强特征表示;然后,在此基础上,将特征送入到所设计的基于小型神经网络的光照感知权重融合模块中,学习获取不同模态所对应的权重,解决了现有光照加权对不同模态的特征按照1:1的方式进行堆叠的问题;最后,将获取到的权重与其相应的特征进行加权融合,生成融合特征,并将这些特征送入行人检测识别网络,完成识别。通过实验证明,该融合策略能够在一定程度上提升行人目标的识别性能。针对现有多模态特征融合模块将生成的融合模块直接用于行人识别网络,存在不同模态之间差异性较大、交互性不够的问题,提出了一种基于多模态特征互指导的行人目标识别算法。首先,通过将生成的可见光特征与红外特征送入到差异特征感知融合模块中缩小两种不同模态之间的差异性,并生成融合特征;然后,将融合特征再返回到可见光与红外特征流中,使下一阶段生成的可见光与红外特征具有更丰富的信息;除此之外,还将融合特征作用于下一阶段的融合特征,增强融合特征的表征能力;最后,将最后一阶段的可见光特征、红外特征及融合特征均送入到识别网络中进行行人目标识别。通过实验证明,该算法进一步提升了目标的识别性能,并增强了模型的鲁棒性能。本文基于特征级融合方式研究可见光与红外两种模态融合下的目标识别算法,通过KAIST数据集对算法进行性能验证的同时,在LLVIP据集、M~3FD数据集上也进行泛化性能验证,在一定程度上表明算法在实际场景的可行性,具有一定的理论研究意义。

其他文献

基于节点序的BN结构学习算法研究

贝叶斯网络（Bayesian Network,BN）是一种图论与概率统计相联结的建模工具,目前已经被广泛地应用在机器学习、数据挖掘以及目标识别等领域。在BN学习中,结构学习是参数学习和推理的基础,因此也是BN研究的重点和难点。在贝叶斯网络结构学习中,依据搜索空间的不同可分为网络结构空间和节点序空间下的搜索算法。与网络空间下的搜索算法相比,基于节点序的搜索算法的搜索空间更小,所以其搜索效率更高。然而

学位

基于混沌的高速率隐蔽通信方法研究

无线通信技术突飞猛进,应用越来越广泛。然而,无线信道传输的信息容易受到干扰或者被截获,从而造成安全隐患。隐蔽通信是力图将通信信号隐藏起来,让敌对方很难感知到通信信号。隐蔽通信通常有两种方式:低截获概率（Low Probability of Intercept,LPI）和低检测概率（Low Probability of Detection,LPD）,其中LPD是比较常用的技术,其主要实现方式是采用直

学位

基于索引调制的VLC-OFDM技术研究

随着现代移动通信技术的飞速发展,人们对其流量要求也越来越高。可见光通信（Visible Light Communication,VLC）不仅具有丰富的频谱资源,还可在进行照明的同时传送信息,同正交频分复用技术（Orthogonal Frequency Division Multiplexing,OFDM）组合可显著改善系统通信特性,但是存在噪声频偏干扰和较高的峰均比等问题,从而降低系统性能。为此,

学位

基于启发式神经网络的水声信道均衡技术研究

由于近年来我国对海洋探索的不断深入,水声通信技术受到广泛关注。而水声信道的通信环境十分恶劣,其中,多径效应导致水声信道中声信号衰减和失真严重。为了克服这类信道问题,通常会在接收端使用均衡器对信道特性进行补偿,以消除信道引起的影响,即信道均衡技术。本文提出了一种基于启发式神经网络的水声信道均衡算法,该算法利用神经网络的非线性和启发式算法的优化能力,其通信质量相较于传统均衡算法有着明显的提升。首先,针

学位

基于深度残差网络的图像超分辨率重建

随着信息时代的快速发展,人们对图像清晰度的要求越来越高,图像分辨率越高,图像中的信息层次越丰富,有利于人们获取更全面的信息。受采集设备和环境等现实因素的影响,导致获取的图像分辨率不佳。使用硬件设备改善图像分辨率成本高,不利于操作,使用软件实现的超分辨率重建技术不仅节约成本而且效果更好,使得应用范围越来越广泛。针对现有的图像超分辨率重建算法对图像细节信息提取不全面的问题,本文以此为切入点展开研究,主

学位

多频段微带滤波器的研究与设计

随着无线通信技术的不断发展,对高频滤波器的性能提出了许多更高要求。同时由于多种无线通信系统共存,因此所研究和设计高频滤波器需要工作在多个频段。然而,各种无线通信设备使用导致现在的电磁环境日益复杂。差分电路有良好的抗干扰性能,因此受到了许多学者的青睐。为了设计出选择性高和抗干扰能力强的滤波器,本文提出了三款单端基于非对称开路枝节加载谐振器的高选择性双频段微带带通滤波器和一款基于非对称短路枝节加载谐振

学位

基于CS与Turbo编码的NOMA-VLC优化研究

在室内可见光通信（Visible Light Communication,VLC）中引入非正交多址接入（Non-orthogonal Multiple Access,NOMA）技术是实现多用户通信及组网应用的有效途径。针对NOMA-VLC系统易受信道环境影响、用户间存在相互干扰、用户间公平性难以保证所带来的通信性能问题,论文结合Turbo码技术与压缩感知（Compressed Sensing,CS

学位

面向对抗任务的无人机集群智能协同策略研究

随着人工智能技术的飞速发展,无人机自主控制决策已成为现代智能空战的核心内容,是当今军事领域最受关注的研究课题。本文以博弈论为基础,结合深度强化学习等计算方法,对不同作战条件下的无人机智能协同策略展开了深入研究,重点研究内容包括:针对动态环境下无人机一对一近距空战的对抗场景,因其博弈态势瞬息万变且决策过程复杂,提出了一种带有免疫导引策略的Minimax-DDQN（（Minimax-Double De

学位

复杂场景下地面小样本军事目标识别算法研究

随着军事科学技术在新形势下不断发展,复杂场景下地面小样本军事目标识别对未来战场信息化联合作战、情报获取与策略制定具有重大意义。由于军事目标的特殊性使其在复杂场景下具备小样本特点,针对现有军事目标识别算法精度低、实时性差与可应用性弱等问题,本文以军事目标为研究对象,采用深度学习技术,从数据集构建、识别模型设计及模型应用三大方面展开研究,主要研究内容如下:（1）复杂场景下地面小样本军事目标数据集的构建

学位

模型不确定条件下雷达目标跟踪方法研究

雷达目标跟踪是通过雷达对空间目标进行跟踪,然后实现对目标状态的准确估计,是现代军事跟踪系统进行数据融合、指挥决策、目标识别等任务的前提。但在战场环境中,由于电磁干扰、热噪声干扰等引起量测噪声不确定和目标机动所造成的系统状态不确定的影响,使得现有的自适应卡尔曼滤波算法难以解决模型不确定条件下的机动目标跟踪问题。因此,针对模型不确定条件下雷达目标跟踪问题开展研究,主要工作如下:（1）针对由于电磁干扰、

学位

基于多模态图像融合的目标识别算法研究

与本文相关的学术论文