基于卷积神经网络的单目深度估计

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:ztbai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度估计在很久之前就在计算机视觉中得到很大的关注,到目前为止仍旧是一个有待继续研究的课题,因为深度估计不同于其他的计算机视觉算法,比如目标检测,人脸识别等,只需处理图像中的二维信息。目前完成深度估计这一任务有很多方法,本文中利用无监督的端到端的神经网络,通过对左右视图的视差进行训练,最终的模型通过一张图即可得到该图的深度图像。本文中创新性地提出将语义分割模型与深度估计算法相结合,有效提高了模型准确性。该模型分为编码器解码器两部分,编码器借助空洞卷积进行特征提取,增加感受野,同时较少地对图像进行下采样,使生成的深度图更加清晰并且准确。本文主要工作和创新性成果如下:(1)运用双目立体匹配算法原理设计单目深度估计模型,并尝试使用不同感受野大小的卷积核进行特征提取的模型。在文章第四部分使用Deep Lab模型提取特征,借助空洞卷积增大感受野优化深度估计。实验证明使用空洞卷积可以更有效地提取图像显著性特征,从而提高实验效果。(2)第五部分创新性地使用Dense Net密集连接模型,搭载感受野更大的空洞卷积,并且避免过度下采样。这种方法能够通过密集连接特征的反复使用的特点,得到更好的结果。解码器阶段通过反卷积与上采样,恢复图像尺寸并且与编码器阶段提取到的底层特征进行跳跃连接,目的是减少图像的信息缺失,能使生成的深度图更加完整清晰。训练过程中使用KITTI与City Scape数据集无标注的数据,进行无监督的端到端训练,使用和现有算法相同的评估标准,取得了当前最优的结果。
其他文献
与经典的图像处理相比,量子图像处理为快速的图像处理提供了一种可能的解决方案,因此广受关注。量子图像二值化是一种运用了量子计算方法的图像二值化操作,在量子图像处理中
图像在现代社会各个领域的正常运转中占领着难以取代的位置,各种成像技术的发展也使得图像的应用愈加广泛,虽然每种成像技术都有其各自的特点和优势,但也因为存在的问题使得
山水画形成于魏晋南北朝时期,在隋唐时期开始成为独立的学科,发展到五代、北宋时期到达了一定的高度。山水画主要是以山川自然景观为描写对象,地域特征则对山水画的风格、意境、构图形式、设色等方面都有着极其重要的影响。我国是一个幅员辽阔的国家,有着丰富的地形地貌,气候特征以及自然生态环境,因此历代的山水画家都从大自然中寻找属于自己的表达方式,进而形成自己独具特色的艺术语言和艺术风格。北裕河深厚的文化底蕴,形
视频动作识别是近年来计算机视觉领域研究热点之一。不同于图像信息,视频动作中连续、多变的时空域信息,使得从复杂的交互场景中识别人的动作变得十分困难。为此,本文基于深
电商平台为用户提供多种反馈方式,如评论、标签和评分等。评论作为评分的补充手段,包含更细粒度的反馈信息。商品有大量的属性特征,用户在评论中具体阐述其对商品各个属性的
随着智能机器人在环境感知、虚拟现实、医学诊断、自动驾驶等应用领域的不断拓展,对智能机器人环境感知和适应能力提出了更高的要求,仅拥有单一或单类传感器的系统难以满足机
随着科学技术与网络技术的迅猛发展,人类已进入大数据和人工智能时代。一方面,数据规模、类型、价值与时效的急剧变化,另一方面,模型场景、环境、需求与计算的日益复杂,人类
基于功能化纳米粒子修饰电极的电化学传感器由于制备方法简单、操作性强、选择性好、灵敏度高、响应时间短、检测成本低等优势,已被广泛应用于工业生产、临床医学、药物分析
如何安全高效地识别个人的身份,是信息化时代必须要解决的一个重要问题。传统的身份识别方法,如身份证、用户名等,存在着容易遗失和泄露等无法克服的缺点,越来越难以满足社会
推进纺织业智能信息化建设不但是国家战略也是行业需求,其中织物疵点的智能自动检测是重中之重,占据重要地位。因其作为纺织业质量控制的重要环节,直接影响产品质量,关系到企