【摘 要】
:
获取数字图像中物体的深度信息,即物距离相机的远近关系,是机器视觉学科一项重要的任务。图像的深度信息一般表示成对应图像的深度图,深度图中每个像素的灰度值代表原图对应像素到相机所在平面的距离。获得的深度图是二维图像进行三维重建的基础,同时也为图像的分割、聚类、识别等提供了新的途径。图像的深度信息还是工业生产实现自动化的重要基础,也是机器人、无人机、无人车等智能机械实现自动寻径、自动规避等功能的重要依据
论文部分内容阅读
获取数字图像中物体的深度信息,即物距离相机的远近关系,是机器视觉学科一项重要的任务。图像的深度信息一般表示成对应图像的深度图,深度图中每个像素的灰度值代表原图对应像素到相机所在平面的距离。获得的深度图是二维图像进行三维重建的基础,同时也为图像的分割、聚类、识别等提供了新的途径。图像的深度信息还是工业生产实现自动化的重要基础,也是机器人、无人机、无人车等智能机械实现自动寻径、自动规避等功能的重要依据。目前获取图像深度信息的方法主要分为多目方法和单目方法。多目方法得到图像深度图的准确度接近激光深度探测器,但需要同一场景的多幅图像进行计算;单目方法可以对单幅图像进行计算,但适用的场景较少且准确度较低。因此本文提出一种可对单幅图像使用的双目视觉模型来估算图像物体间的相对深度值。主要工作如下:首先,本文对传统双目模型原理进行深入分析,提出一种基于SFS算法的改进双目模型方法。方法首先利用SFS算法得到图像初始深度值,再利用初始深度值计算得到双目模型参数,最后利用双目模型参数计算出物体的深度值。然后,针对引入SFS算法引起的物体深度值不统一问题,提出一种结合物体轮廓信息的深度值赋值方法。通过计算物体轮廓区域内的众数,对每个物体赋予一个统一的深度值,生成图像的深度图。再利用伪消失点法修正深度图,选定消失点计算消失线,并依据消失点与消失线的特性对图像的深度值进行调整,使图像深度值的计算更加准确。最后,将上述方法应用于图像鉴别与自动驾驶。利用镜像原理,上述方法得到的深度图能够分辨具有镜像特征的CG图(计算机图像),经实验数据拟合出一个幂函数作为物体的距离模型,该模型在一定程度上可以反映图像中物体间的真实距离关系。经实验验证,本文双目模型可以得到单幅图像的深度信息,不需要进行相机标定,不需要进行立体匹配,对图像场景要求较低,适用范围较广。
其他文献
现实世界中的网络无处不在,如何对越来越多、越来越庞大的网络进行高效地分析和处理在当今世界至关重要。针对网络分析的研究中存在一个关键的问题,研究怎样合理地表示网络的
房地产行业作为我国的基础产业之一,每年为国家GDP贡献了大量的收入,对拉动经济有着举足轻重的作用,房地产从90年代房改开始到如今,已经累计了大量的销售数据、客户数据、建
在目前意识下视觉认知研究中,由于研究任务的多元化和复杂化,对方法论的要求越来越高。在一些经典方法的基础上,科学家发展出一种新的方法——连续闪烁抑制范式(continuous flash suppression,简称CFS),并广泛地应用于意识下视觉认知研究。之前研究者主要是应用CFS来实现对视觉刺激的抑制,完成对意识下视觉处理过程的研究,但没有专门针对CFS本身的研究。由于研究者对CFS本身没有系
NVM等高性能存储器件的快速发展为分布式文件系统带来了数据访问性能的大幅提升,同时也为系统的数据处理能力与网络传输能力提出了新的要求。对于这一问题,RDMA技术是一个比较合适的解决方案,它能以更少的计算资源提供更强的网络传输能力。但是现有的工作往往只将RDMA传输作为系统的网络传输模块使用,并没有利用RDMA技术的特性将其与文件系统的数据处理进行有效的整合与适配。这导致了分布式文件系统网络传输层与
柔性印刷电路基板(Flexible Printed Circuit Board,FPC)是集成电路的重要组成部分,已广泛用于各种电子产品中。FPC缺陷检测可以提高制造过程中的FPC成品率,是制造商生产过程
沪港通、深港通的开通使跨境投资日趋便利。由于语言和制度等方面的差异,跨境投资涉及诸多风险。投资者教育作为投资者保护的重要手段,在中国仍存在资源不足等问题。招股书是股份公司首次公开募股时必须对外发布的文件,目的是让公众了解公司情况,同时吸引投资。当前学界基于投资者教育对招股书的研究并不多,对招股书的语用研究则更为罕见。为了丰富投资者教育内容,同时提升个人投资者对招股书的解读能力,从而更好地保护投资者
证明商标与普通商标虽同为《商标法》所规制,但二者在性质和功能等方面上皆存有差别。就普通商标而言,商标权人有权禁止任何人未经许可在同种商品上使用相同商标,或类似商品上使用与注册商标相同或近似的商标,从而导致消费者有混淆误认可能的行为。无论使用人生产销售商品的品质如何,即使品质相同甚至更优,只要未经权利人许可,就不得擅自使用。证明商标是用来标示商品原产地、原料、制造方法、质量或其他特定品质的商标,其创
目标检测技术是一种识别并定位图像中特定目标的技术,它是图像理解的一个重要环节,一直以来都是国内外学者的研究热点。随着卫星技术的发展,尤其是高分三号等卫星的发射,大量
键值存储是现代存储系统的重要组成部分,由于LSM-tree数据结构针对磁盘的随机写做了优化,大幅度提升了键值存储系统的写性能,因此基于LSM-tree的键值存储成为主流。为了克服LSM-tree在读写操作中仍然产生较高的读写放大现象,进一步发展成为采用键值分离的键值存储系统。然而,采用键值分离的键值存储系统在更新密集型工作负载下会频繁的触发垃圾回收(GC)操作,导致其无法实现较高性能。针对上述问题