基于深度学习的红外视频场景深度估计方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:bianhao9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
红外视频深度估计是机器学习、计算机视觉等领域中的热点研究问题之一。近些年来基于几何光学方法、传统机器学习方法和深度学习方法的深度估计研究取得了很大的进步。然而,现有多数深度估计方法将视频看成独立的单帧图像序列,然后分别估计这些单帧图像的深度,且在模型训练学习过程中未引入对抗学习等优化方式。本文针对上述问题展开研究,主要的研究成果包括:  (1)本文提出了一种基于双向递归卷积神经网络的红外视频深度估计方法。双向递归卷积神经网络可以在提取红外视频中任意一帧图像特征的同时从两个方向加入红外视频的序列特性,将红外视频看成一个有序的整体来估计其深度。  (2)本文提出了一种基于编码器特征融合的红外视频深度估计方法。通过在编码器中引入相似约束,即保持各个数据之间的距离相对不变,来编码红外视频中每一帧图像及相邻两帧图像的光流特征,然后将每一帧图像的特征以及红外视频整体的光流特征通过特征融合的方式合成到一个特征向量中,最后使用该特征向量估计红外视频中对应图像的深度。  (3)本文提出了一种基于对抗学习的红外视频深度估计方法。在传统的深度神经网络提取红外视频特征过程中引入了对抗学习,对抗学习的误差与传统的重建误差共同构成特征提取中误差。
其他文献
随着高清摄像机在智能交通系统中的推广应用和图像处理技术的发展,基于图像的检测技术已成为最重要的车辆检测方法之一,并得到广泛的研究,在车辆检测准确率上不断提高。但是在城
脑作为人类神经系统的中枢,是一个精细、复杂和高效的系统,控制着人类的情感、思维和行为。探索脑的结构和功能、揭示脑的工作机制,是重大的科学前沿。现代影像技术的发展为人类
近年来,层次短语翻译系统逐渐成为实用的统计翻译系统之一。通过引入形式化的句法结构,层次短语翻译系统能够有效处理短语翻译系统所面临的长距离调序、规则泛化等问题。由于层
学位
随着互联网技术的快速发展,多样、异构、稀疏、海量的数据呈指数级快速增长。如何有效地表示和深入理解这些大数据已经越来越受到人们的重视,甚至已经成为当前的重要研究课题。
随着移动互联网的迅速扩张,网络购物大大地提升了人们的生活质量。在此背景下,许多电子商务网站提供了产品评价平台,以方便用户分享产品使用经验以及对产品的满意程度作出评价。
随着计算机和网络技术的广泛使用,网络安全防护成为一个研究热点。入侵检测技术是保障网络安全的重要手段,基于人工智能算法的入侵检测方法成为了当前网络安全领域的重要研究课
胶囊内窥镜的出现和发展,为小肠疾病患者提供了有效而低痛苦的检测手段。然而,胶囊内镜同时也有低效、漏检的缺点,甚至存在一定的危险性,因此,现实需要发展胶囊机器人技术,赋予胶囊
随着工业开始朝着大规模、复杂化的方向发展,针对工业生产的过程监控和故障检测成为了工业系统中备受关注的问题之一。如何从大量数据中挖掘出隐藏的有用信息,使其能够服务于
视觉是人类认识和理解世界的首要途径。长久以来,人们都希望能够在人工系统上复刻人类的视觉能力。其中,视觉分类是最受关注,最为核心,也是实现起来最具挑战性的视觉功能之一。同