基于单幅图像深度估计方法的设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:hscyg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们在使用普通的设备获取图像时通常只会保存场景的二维信息,丢失场景的深度信息,但实际上深度信息对于一些视觉方面的研究工作有着非常重要的作用。深度估计可以用于三维建模、场景理解、深度感知等领域。随着虚拟现实,自动驾驶,3D电影等应用场景的不断普及,技术上对三维层面信息的需求越来越强烈。在单目深度估计上仍然存在很多问题,深度真值获取困难、成本昂贵;单幅图像的特征有限,特征的局限性增加了训练的难度。本文针对单幅图像的深度估计提出了结合双目立体视觉的深度估计方法,首先使用卷积神经网络进行特征提取,随后利用特征图进行另一视点图像的估计,最后利用左右视图进行视差估计,计算出深度图。本文的主要工作如下:(1)提出两个阶段的深度估计方法,第一阶段为视图合成部分,第二阶段是双目匹配部分,增强了深度估计方法的灵活性。(2)将双目数据集替代深度数据集应用于深度估计,在视图合成网络部分进行训练模型从而获取另一视点的图像,减少了对深度真值的需求,大大降低了数据集成本。(3)将用于分割,视差以及光流的主要网络结构(Encoder-Decoder结构)应用于深度估计,充分利用双目图像几何关系计算深度值的同时也更好的利用的低层的特征保证了网络对与细节的估计。(4)鉴于深度估计是针对单幅图像进行估计的,在连续帧的一致性存在问题,所以在深度优化阶段采用了图像增强算法以及滤波器对深度图像中的特征显示错误以及连续帧之间的平滑程度进行了优化,如联合双边滤波、导向滤波、中值滤波等滤波算法。实验结果表明,本文的方法能够优于大部分的基于深度学习的深度估计方法,并且能够实际应用于2D视频转3D视频项目。
其他文献
随着近些年物联网、大数据处理、人工智能等技术的不断发展,“新零售”这个概念于2016年应运而生。自动售货机作为零售业重要组成部分,因为其工作、部署不轻易受到地点、时间等外在条件限制,越来越受到运营商青睐,它的发展与壮大已然成为必然趋势。对于通用型自动售货机,国内外研究主要集中于传统销售动作实现与信息统计和远程监测。本文设计与实现了一种基于ARM处理器的面向新零售应用的智能终端,支持各种通信协议,可
协作通信技术能够有效克服无线信道的多径衰落与路径损耗等问题,提高无线网络的覆盖范围、信道容量以及信息传输的可靠性,是当今无线通信系统中十分重要的一项技术。传统的无线协作中继多采用半双工(Half-Duplex,HD)模式,即中继节点信号的接收与发送占用不同的时间或频带资源,从而造成通信资源的浪费,导致频谱效率降低。随着射频技术特别是自干扰(Self-Interference,SI)消除技术的不断发
随着互联网和信息技术的飞速发展,在线社交网络已经成为人们分享生活和获取信息的重要媒介,同时也成为了商家进行商品推广的重要渠道。商家在对商品进行推广时通常会采用“病毒式营销”的方式,即选择一定数量具有影响力的用户免费试用,通过用户间的口碑效应使得社会网络中有更多的人接纳该商品。在对“病毒式营销”的深入研究中,学者将其抽象为影响力最大化问题。经典的影响力最大化问题主要研究的是单条信息在一个网络中传播的
工业污泥可通过热解技术快速转化为热解气、油及污泥炭等产品,实现资源化利用。然而,污泥含水率高、热值低、重金属含量高导致热解过程耗能高、反应特性差和产物品质低等问题。添加生物质进行共热解可为热解反应提供能量、固化重金属以及提高产物品质,具有良好的应用前景。本文从工业污泥与生物质共热解制炭及其对重金属固化特性出发,首先研究了共热解成炭特性和反应协同耦合机制,其次研究了共热解过程中重金属迁移与转化规律,
数字化X射线摄影(Digitial Radiography,DR)是计算机数字图像处理技术与X-射线放射技术结合而形成的常规X线摄影技术。DR因辐射剂量小、灵敏度高、图像分辨率高、处理速度快等优点,一直受到医疗人员的认可,已经被广泛应用在医学影像领域。但是,DR摄影成像过程中,会不可避免地产生一些影响图像成像质量的散射射线。因此,有效地校正DR图像中的散射射线将可以提高DR图像的成像质量,并且降低
语义角色标注(Semantic Role Labeling,SRL)是自然语言处理的基础应用,目前主要采用深度学习的方法,例如Highway Bi-LSTM模型。虽然该模型中的Highway结构可以加快网络收敛速度,但是存在以下问题:1)主要利用词形、词性、是否谓词等信息,很少利用句子结构信息,例如依存句法结构等。2)需要根据句子长度进行相应时间步的计算,难以在长句中距离较远的词之间建立语义联系,
依存句法分析是自然语言处理中的一项重要任务,主要包括基于图的和基于转移的两种分析方法。目前基于转移的依存句法分析方法大多采用BiLSTM模型,它虽然可以捕获句子中双向较长距离的依存关系,但是存在以下问题:1)模型复杂、计算量大,导致训练时间过长;2)当中心词和依存词距离大时准确率偏低。针对以上问题,本文的主要工作如下:(1)针对模型训练时间长的问题,本文在经典BiLSTM模型的基础上提出BiLST
在经济飞速发展的今天,高速的生活方式催生了一大批亚健康的人群,随着信息的膨胀与生活理念的改变,人们对于健康愈加重视,室内运动需求日益增大。但是室内场地的局限性,室内器材健身很大程度上缺乏趣味,且个人运动无法提供很好的运动建议。针对这些问题,本文以跑步机为例,搭建虚拟场景模拟户外环境,从外观造型、应用界面以及健身指导等方面进行研究,旨在追求更人性化的设计,更安全的用户体验。1、本文搭建了由跑步机、安
近年来,基于位置的服务快速发展,室内位置服务所需的室内定位技术成为研究热点。室内环境中无法接收GNSS信号,而其他定位手段,如蓝牙、Wi Fi、RFID、超宽带等均具有明显的缺点。在此条件下,伪卫星技术由于其具有精度高、与GNSS信号兼容、室内外切换方便等优点,成为具有广阔研究前景的室内定位技术。但是目前伪卫星技术在室内定位中面临着信号易被遮挡、多径效应、时间同步等问题,发展受到一定限制。通过分析
协作机器人关节力感知能力是指协作机器人对外界力信息的感知和测量能力,是协作机器人完成力交互与力控制的基础。目前大部分研究常使用模块化关节力矩传感器完成力信息的感知。但利用模块化关节力矩传感器不仅需要处理好机器人整体刚性问题,而且需要处理好模块化关节力矩传感器带来的位置精度问题。注意到谐波减速器作为协作机器人关节内的核心传动零件,十分适合作为协作机器人力感知能力的实现载体。因此,本文以谐波减速器为主