基于卷积神经网络和融合ToF与立体数据的高质量深度图获取算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yxhangyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景深度信息的估计是计算机视觉的一个基本问题,并具有多种应用如机器人视觉、自动导航、目标跟踪,以及动作识别等。到目前为止,研究人员已经提出了许多场景深度信息的估计方法,主要分为主动式深度信息估计和被动式深度估计。主动式深度估计包括利用ToF(Time of Flight)相机或Kinect相机这样的主动装置获取深度。被动式深度估计主要利用双目相机进行立体匹配从而通过估计的视差来获取场景的深度信息。被动立体匹配在具有较多纹理信息的场景上具有很好的效果,可以提供高分辨率的场景深度图估计,但是在具有重复模式纹理或图像平滑区域将很难对深度进行估计。主动方式如利用ToF相机和Kinect相机在进行深度估计时则不受场景表面纹理的影响。然而,获取的深度图的分辨率很低,同时会产生系统误差,如在深度不连续边界区域的深度交错、物体不同反射率引起的噪声和飞行像素,尤其是在低反射率区域,出现系统误差的概率会大大增加。因此,获取高质量的深度信息可以通过三个方面着手包括:1.通过对低分辨的ToF相机获取的深度图像进行超分辨重建和去噪。2.通过设计更鲁棒的立体匹配算法,解决传统立体匹配算法在光滑和纹理重复区域深度难以估计的问题。3.利用ToF相机和立体匹配深度获取方式的互补性,将ToF和立体匹配数据进行融合从而产生高质量的深度图。针对这三种方式,我们在前人研究的基础上提出了自己的深度图像增强算法。本文的主要工工作如下:1.提出了一种新的基于边缘引导的单幅深度图的超分辨率算法。该算法首先利用三次插值对深度图进行初步上采样,然后提取上采样后深度图的边缘,该边缘是低质量的。随后利用深度卷积神经网络(CNN)将低质量边缘转化为高质量的边缘。最后在高质量边缘图的引导下,采用总变分(TV)模型对初始深度图进行上采样。利用高质量边缘作为引导将可以避免直接通过深度数据进行估计带来的伪影误差,而且可以去除边缘的阶梯效应,获取锐利的边缘。2.提出了一种基于3D卷积神经网络的立体匹配算法(3DCNN)。传统的深度立体匹配总是依靠暹罗网络提取左右对应图像块的特征,确定图像块匹配与否从而获取视差信息。但是这种方式很难处理遮挡和表面光滑的场景。本文提出了一个新的算法,利用3D卷积提取场景的颜色特征和视差特征。将该问题转化为多分类问题,分类的个数是视差的取值范围。同时本文提出了一种新的彩色图像引导滤波器来对图像进一步处理,进一步提高了算法的准确度。3.基于本文设计的边缘选择联合滤波器,通过融合ToF相机获取的深度图和立体匹配视差图获得高质量的深度图。利用边缘选择联合滤波器,可以从低分辨的ToF深度图、场景的色彩图和立体匹配的视差图获得对应的高质量的边缘图。同时分别对ToF深度图和立体匹配深度图的置信度进行估计,最终利用提出的总变分模型,将获得的边缘图像作为数据平滑项的权值,成功地融合了ToF和立体匹配深度图,在保留深度图边缘的同时消除了深度图的噪声。
其他文献
顽固性高血压成为威胁全球人类身心健康的一项巨大挑战。去肾交感神经术是一种新型有效治疗顽固性高血压的微创手术方法。这一术式通过电极传递射频能量,在肾动脉内紧贴血管壁执行射频消融。相关研究表明,当温度达到有效治疗靶目标45℃以上时,肾交感神经实现不可逆性损伤,从而抑制交感神经的过度激活,实现降压。由于传统的治疗方式为单极治疗,其导管仅包含单个电极,并且仅能进行逐点消融,因此很难实现一次性360°完全消
随着网络技术、云计算及大数据的发展,图像、语音、文本、视频等多媒体在互联网上广泛传播。数据传输更加快捷方便,我们的生活得到很大的改变。但是机遇与挑战是并存的,在快捷方便的同时,大量的信息数据通过多种渠道的传输,被非法的窃取信息、篡改信息等,对信息安全领域造成危害。而数字图像作为信息的载体,对其进行安全保护是信息安全的一种有效方法。与文本相比,图像具有容量大、冗余性高、像素相关性强等特点,传统的加密
抽象语义表示(Abstract Meaning Representation,AMR)是一种全新的、领域无关的句子语义表示方法,它将一个句子的语义抽象为一个单根有向无环图,AMR解析旨在将句子解析为对应
随着社会经济的发展,商业文化日渐成熟,大众的文化艺术权利日益受到重视。波普艺术作为大众艺术和流行艺术发展的重要艺术运动,为我们研究今日商业视觉文化与大众艺术文化权益提供了良好的切入点。本论文研究中通过解读波普艺术的发展及波普艺术实践中的商业案例以厘清商业视觉符号、文化消费与文化价值的关系,在明晰波普艺术发展吸纳了商业视觉元素同时指出了波普艺术中艺术作品在消费社会中商品化的进程。波普艺术于商业视觉文
中小型民营企业已经逐渐成为我国国民经济的重要组成部分,发展潜力巨大。目前,大多数中小型民营企业的员工满意度不高,无法激发员工的工作热情和工作主动性,为企业创造更高的利润。因此,企业必须设法提高员工的满意度并激发他们的潜能,以确保企业的可持续发展,为企业提供强大的核心竞争力。本文以Z公司为研究对象,运用员工满意度的相关概念及影响因素、需求层次理论、家长式领导理论等相关理论及文献,对Z公司目前的员工满
人体通常有40%至60%的脂肪存储在皮下组织,因而皮下脂肪厚度可以作为人体脂肪含量的指标。脂肪堆积过多会导致肥胖,肥胖会引进高血压、冠心病等一系列疾病,是健康的头号杀手。并且由于人体内脏脂肪和皮下脂肪分布不同,会引起不同的患病风险,所以检测内脏脂肪和皮下脂肪含量,在临床疾病的诊断方面具有非常重要的意义。而测量皮下脂肪厚度既可以满足健康需求,也可以满足大众健身和减肥等特殊需要。本论文根据实际需求设计
混凝土坝仓面混凝土施工综合控制始终是水利工程施工建设中的研究重点。大坝智能建造在水利信息化背景下孕育而生并逐步发展,数以千计的浇筑仓所积累的海量施工数据信息为大坝仓面混凝土施工提供了更多思路,充分合理地认知并运用施工数据是大坝施工组织管理的基础。本文以白鹤滩工程仓面混凝土施工为研究对象,剖析大坝施工数据挖掘的指导性意义,对白鹤滩大坝仓面混凝土施工数据信息展开深入挖掘,针对不同挖掘目的采取相应挖掘方
随着机器学习的发展,人脸识别技术得到越来越多的关注。通过人脸图像,可以识别或者验证一个人的身份。人脸识别通常是通过比较测试的人脸特征与人脸库中特征来实现的。虽然人
本文分析研究了山东女子赛艇队备战第十三届全国运动会的四条舟艇做为研究对象,观察四条不同赛艇在备战比赛和训练期间不同桨频变换训练的成绩变化和生理指标特征,根据多年的
目的:研究宫颈鳞状细胞癌(Cervical squamous cell carcinoma,CSCC)、鳞状上皮内病变(Squamous intraepithelial lesion,SIL)与宫颈良性病变宫颈组织中SIRT1、β-catenin的表达情况,并分析两者的表达与CSCC患者的临床病理学参数之间的关系;同时分析CSCC组织中SIRT1与β-catenin之间的表达关系,并初步确定两者的