论文部分内容阅读
红外视频深度估计是机器学习、计算机视觉等领域中的热点研究问题之一。近些年来基于几何光学方法、传统机器学习方法和深度学习方法的深度估计研究取得了很大的进步。然而,现有多数深度估计方法将视频看成独立的单帧图像序列,然后分别估计这些单帧图像的深度,且在模型训练学习过程中未引入对抗学习等优化方式。本文针对上述问题展开研究,主要的研究成果包括: (1)本文提出了一种基于双向递归卷积神经网络的红外视频深度估计方法。双向递归卷积神经网络可以在提取红外视频中任意一帧图像特征的同时从两个方向加入红外视频的序列特性,将红外视频看成一个有序的整体来估计其深度。 (2)本文提出了一种基于编码器特征融合的红外视频深度估计方法。通过在编码器中引入相似约束,即保持各个数据之间的距离相对不变,来编码红外视频中每一帧图像及相邻两帧图像的光流特征,然后将每一帧图像的特征以及红外视频整体的光流特征通过特征融合的方式合成到一个特征向量中,最后使用该特征向量估计红外视频中对应图像的深度。 (3)本文提出了一种基于对抗学习的红外视频深度估计方法。在传统的深度神经网络提取红外视频特征过程中引入了对抗学习,对抗学习的误差与传统的重建误差共同构成特征提取中误差。