基于深度学习的红外视频场景深度估计方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户：bianhao9527

【摘要】

：

红外视频深度估计是机器学习、计算机视觉等领域中的热点研究问题之一。近些年来基于几何光学方法、传统机器学习方法和深度学习方法的深度估计研究取得了很大的进步。然而，现

【作者】

：

吴寿川

【机构】

：

华东理工大学

【出处】

：

华东理工大学

【发表日期】

：

2018年期

【关键词】

：

单目红外视频深度估计深度学习序列学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

红外视频深度估计是机器学习、计算机视觉等领域中的热点研究问题之一。近些年来基于几何光学方法、传统机器学习方法和深度学习方法的深度估计研究取得了很大的进步。然而，现有多数深度估计方法将视频看成独立的单帧图像序列，然后分别估计这些单帧图像的深度，且在模型训练学习过程中未引入对抗学习等优化方式。本文针对上述问题展开研究，主要的研究成果包括:　　(1)本文提出了一种基于双向递归卷积神经网络的红外视频深度估计方法。双向递归卷积神经网络可以在提取红外视频中任意一帧图像特征的同时从两个方向加入红外视频的序列特性，将红外视频看成一个有序的整体来估计其深度。　　(2)本文提出了一种基于编码器特征融合的红外视频深度估计方法。通过在编码器中引入相似约束，即保持各个数据之间的距离相对不变，来编码红外视频中每一帧图像及相邻两帧图像的光流特征，然后将每一帧图像的特征以及红外视频整体的光流特征通过特征融合的方式合成到一个特征向量中，最后使用该特征向量估计红外视频中对应图像的深度。　　(3)本文提出了一种基于对抗学习的红外视频深度估计方法。在传统的深度神经网络提取红外视频特征过程中引入了对抗学习，对抗学习的误差与传统的重建误差共同构成特征提取中误差。

其他文献

城市交通场景下基于与或图模型的车辆检测方法研究

随着高清摄像机在智能交通系统中的推广应用和图像处理技术的发展，基于图像的检测技术已成为最重要的车辆检测方法之一，并得到广泛的研究，在车辆检测准确率上不断提高。但是在城

学位

城市交通场景车辆检测与或图模型混合图像模板概率模型

磁共振脑图像分割和配准中的若干问题研究

脑作为人类神经系统的中枢，是一个精细、复杂和高效的系统，控制着人类的情感、思维和行为。探索脑的结构和功能、揭示脑的工作机制，是重大的科学前沿。现代影像技术的发展为人类

学位

脑图像分割精度功能配准算法

面向大规模双语语料的层次短语统计机器翻译技术研究

近年来，层次短语翻译系统逐渐成为实用的统计翻译系统之一。通过引入形式化的句法结构，层次短语翻译系统能够有效处理短语翻译系统所面临的长距离调序、规则泛化等问题。由于层

学位

层次短语翻译系统双语语料模型模拟

多零件微装配系统视觉测量与控制技术研究

学位

不同结构数据的图模型机器学习研究

随着互联网技术的快速发展，多样、异构、稀疏、海量的数据呈指数级快速增长。如何有效地表示和深入理解这些大数据已经越来越受到人们的重视，甚至已经成为当前的重要研究课题。

学位

数据处理图模型结构分析机器学习算法优化

面向大规模互联网数据的细粒度观点挖掘方法研究

随着移动互联网的迅速扩张，网络购物大大地提升了人们的生活质量。在此背景下，许多电子商务网站提供了产品评价平台，以方便用户分享产品使用经验以及对产品的满意程度作出评价。

学位

互联网数据自动观点挖掘系统句法分析单语词对齐模型词向量学习法

基于MTLBO-SVM的网络入侵检测方法研究

随着计算机和网络技术的广泛使用，网络安全防护成为一个研究热点。入侵检测技术是保障网络安全的重要手段，基于人工智能算法的入侵检测方法成为了当前网络安全领域的重要研究课

学位

计算机网络入侵检测教学算法支持向量机

基于小肠力学本构模型的胶囊机器人动力学研究

胶囊内窥镜的出现和发展，为小肠疾病患者提供了有效而低痛苦的检测手段。然而，胶囊内镜同时也有低效、漏检的缺点，甚至存在一定的危险性，因此，现实需要发展胶囊机器人技术，赋予胶囊

学位

胶囊内窥镜微型机器人粘弹性本构驱动器设计

数据驱动的多阶段间歇过程监控方法研究

随着工业开始朝着大规模、复杂化的方向发展,针对工业生产的过程监控和故障检测成为了工业系统中备受关注的问题之一。如何从大量数据中挖掘出隐藏的有用信息,使其能够服务于

学位

过程监控间歇过程KM-PCAJITL-PCA

基于生物认知机制的视觉分类算法及其应用

视觉是人类认识和理解世界的首要途径。长久以来，人们都希望能够在人工系统上复刻人类的视觉能力。其中，视觉分类是最受关注，最为核心，也是实现起来最具挑战性的视觉功能之一。同

学位

视觉分类算法生物认知层级结构模型人机交互图像处理

基于深度学习的红外视频场景深度估计方法研究

与本文相关的学术论文