【摘 要】
:
在空中作战对抗过程中,三维目标的姿态以及距离远近等因素在短时间内可能发生剧烈变化,对目标瞬时大机动时出现的所有姿态进行准确识别是保证实时精确打击的关键。目标的三维信息在机载、弹载成像设备中呈现的是视角连续变化的二维图像信息,因此掌握并利用目标的运动变化信息是展开三维目标识别的重要手段。而随着深度学习技术在各个领域的发展,尤其是具有高层特征信息提取能力的深度学习目标识别技术的突破,为进一步提高作战武
【基金项目】
:
国家自然科学基金(编号:61771400)“基于时空感知深度卷积神经网络的空天三维目标识别研究”;
论文部分内容阅读
在空中作战对抗过程中,三维目标的姿态以及距离远近等因素在短时间内可能发生剧烈变化,对目标瞬时大机动时出现的所有姿态进行准确识别是保证实时精确打击的关键。目标的三维信息在机载、弹载成像设备中呈现的是视角连续变化的二维图像信息,因此掌握并利用目标的运动变化信息是展开三维目标识别的重要手段。而随着深度学习技术在各个领域的发展,尤其是具有高层特征信息提取能力的深度学习目标识别技术的突破,为进一步提高作战武器的自主化打击性能提供了契机。本文采用三维目标在机动变化时所呈现的二维视频图像序列,并结合该过程中目标的时空变化特性来开展三维信息的反向推演、感知,研究了基于深度学习方法及时空信息感知的三维目标识别技术,论文所展开的具体工作内容如下:首先,考虑图像采集设备获取的原始图像数据具有较高的冗余度,不利于目标有效信息的获取,提出了基于胶囊网络及自注意力机制的关键帧提取算法。从序列内部变化机制出发,挑选出序列中能够表征关键信息的帧组成关键帧序列,能在三维运动目标原始变化特性保持不变的条件下有效减少序列的冗余程度。其次,为了利用目标机动过程中的时空变化信息进行三维目标的识别,且考虑到时间信息与空间信息不同耦合程度对运动过程的理解差异,分别提出了基于时空松、紧耦合卷积神经网络的三维目标识别模型。时空松耦合模型分别提取目标的空间特征和时序特征并融合形成时空融合特征来进行三维运动目标的状态表达;而时空紧耦合模型将所有空间特征进行时序建模进而形成时空融合特征来完成目标的表征。在形成时空融合特征之后,为了进一步提高三维目标不同姿态的识别精度,引入了距离度量损失函数,有效增加三维目标所有姿态的聚合性。最后,本文选取八种不同类别的三维运动目标作为识别对象,分别展开时空松、紧耦合卷积神经网络的详细实验并进行了两者的对比分析。实验结果表明,本文提出的时空松、紧耦合卷积神经网络模型具有较强的三维运动目标识别能力,不同目标的相似姿态以及相同目标差异较大的姿态都能实现较为准确的识别。同时,测试过程中关键帧提取的可靠性以及模型计算的快速性也均得到较好的验证。
其他文献
超声换能器设备凭借着自身优势在现代工业及生活中有着极为普遍的应用场景,比如:超声切割、超声焊接、超声清洗等。超声换能器的工作过程中,通常为了获得更高的输出功率从而提高效率,必须使得换能器振动系统在整个工作过程中维持在谐振状态,即要求换能器驱动电源的驱动频率和超声换能器自身的谐振频率保持一致。然而在实际生产或者是工业过程中,换能器工作环境温度的波动、换能器磨损等等其他因素,都会致使超声换能器自身谐振
互联网金融的迅猛发展给商业银行的发展与创新能力的提高提出了很大的挑战。互联网金融的席卷使商业银行的市场份额减少,同时也导致了存贷款利差的减少、传统业务收入的下降,银行的盈利规模已经呈现下降趋势,商业银行的生存与发展已经面临巨大的冲击。互联网金融的发展已经引发了金融业的“鲶鱼效应”。在疫情弥漫的特殊时期,互联网金融的便捷、零接触优势日益显现,为了应对互联网金融带来的冲击,商业银行主动破局,开始创新开
尿沉渣图像识别与分类系统是全自动尿沉渣分析仪的核心。传统的尿沉渣检查法实验步骤繁琐,中间干扰环节多,可重复性差。因此,运用数字图像处理技术对尿沉渣图像中的有形成分进行准确、快速地识别与分类,应用于尿沉渣自动识别与分类系统,对于实现医学图像的智能化、科学化分析具有重要意义。针对此问题,本文对尿沉渣图像进行有针对性的预处理;采用Mean-shift聚类和Canny算子融合的自适应分割算法分割尿沉渣图像
质子交换膜燃料电池作为一种高效能源转换装置,在能源危机日益严峻的现代成为了人们关注的热点。磺化碳氢膜普遍具有成本低廉、原料来源广泛、热稳定性高、机械性能好等优点,有望成为全氟磺酸膜Nafion?的替代品。磺化聚苯并咪唑(S-PBI)通常比其它种类磺化碳氢聚合物具有更好的化学稳定性,这有利于提高燃料电池的使用寿命;然而,由于咪唑基与磺酸基之间的酸-碱作用,磺化聚苯并咪唑膜的质子电导率显著偏低,阻碍了
伴随着我国建筑结构逐渐向大型化、复杂化方向发展,如何有效避免因地震而导致的建筑结构破坏,成为现代建筑结构减灾防灾所面临的巨大挑战。近年来,基于结构振动控制的减震理论和技术的快速发展,特别是半主动控制,具有在较小外部能量输入下即可达到较好振动控制效果的优点,在结构振动控制领域得到了持续关注与初步应用,已成为土木工程防灾减灾领域的研究前言和热点方向。变论域模糊PID(VUFP)算法能够取得较好的半主动
由于2020年初新冠肺炎疫情的影响和世界经济发展前景不明朗,我国央行持续开展宽松货币政策以向金融市场注入流动性,其中借贷便利类工具、定向降准等结构性货币政策操作频繁。我国结构性货币政策于2013首次出现,目前已衍生出多种政策工具。在巴塞尔协议与我国银保监会的监管要求下,商业银行必须满足流动性指标要求,而结构性货币政策推出的目的之一即流动性供给。结构性货币政策的效用并不能独立于传统货币政策而确定,其
作为一种重要的信息载体,财务报告直观反映了一个企业的经营情况,是投资者进行投资决策的重要依据。而当下愈加泛滥的财务重述现象,严重影响了财务报告的可靠性,扰乱资本市场的运行秩序。正因为财务报告的质量与投资者利益和管理层水平存在密切关系,所以在当下的资本市场中,高质量的财务报告显得尤为重要。而内部控制的目标之一是确保企业财务报告及相关信息的准确性。财务重述事件的出现在一定程度上反映了前期披露的会计信息
经过第十三届全国人民代表大会第一次会议批准,国务院正式成立应急管理部和下属的消防救援局,明确指出国家综合性消防救援人员是应急救援主力军和国家队。消防救援人员具备优秀的体能素质,在灭火救援作战中队伍的战斗力就有了保障。只有对体能训练工作进行更好的优化,才符合现代应急救援工作的需要。本研究立足于消防救援人员体能训练的进一步优化,以C市消防救援支队的全体基层指挥员为调查对象,来分析消防救援人员体能训练。
数字多媒体不断创新进步,摄像设备的价格越来越低廉,视频编辑软件使人们可以轻而易举地对数字图像和视频进行篡改。篡改后的图像和视频能轻易地蒙骗人们的眼睛,混淆视听。视频篡改取证技术可以给司法取证提供依据,具有重要的社会意义。而双重压缩检测技术是视频篡改取证技术中非常重要的一种。图像或者视频在篡改的过程中,至少会经过两次压缩。双重压缩检测技术可以为图像或者视频的真实性提供一定的参考证据。随着H.264压