基于非参数多线索融合的单目视频深度图估计研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:a0126051548
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着三维视频需求的快速增长,二维视频的三维转化问题成为计算机视觉和多媒体分析新的研究热点之一。针对大部分已有的视频转换算法需要恢复相机参数的问题,本文设计了一种基于多线索非参数化融合的单目视频深度图提取方法。在非参数学习的基础上,联合图像轮廓线索、几何透视线索及帧间空时相关性,估计相对准确的视频深度图序列。本文的主要研究工作和创新如下:1.针对目前的深度图估计大多使用单一深度线索且容易出现深度估计偏差的问题,提出一种基于前景背景融合的单目图像深度图估计方法。其中前景深度层主要反映场景显著性区域内的深度,其估计方法是建立在具有相似语义或光学度量的场景具有相似深度的假设上;背景深度层反映场景整体的深度分布趋势,通过分析场景的几何透视线索获得。2.针对基于非参数化学习估计的初始前景深度图存在边界模糊、场景结构相对杂乱的问题,提出一种基于图像分段诱导的初始深度优化方法。首先,基于图模型对原始图像进行过分割,利用其分割结果划分图像场景中的不同物体;接着,在初始前景深度图中相应的各分割区域内,采用均值赋值法优化深度值。该方法能将场景中物体边界及其位置信息有效地嵌入至相应深度图以改善其精度。3.和传统的基于几何线索的深度图估计不同,本文采用线性透视原理提取背景深度图。借助语义自动成组AGS(Automatic Grouping of Semantics)方法估计单目图像中相应的消失点,据此线性地分配背景深度层中的深度信息。背景深度层的几何线性透视类型有如下五类:上-下透视、左-右透视、右-左透视、左上-右下透视和左下-右上透视。该方法提取的背景深度层能整体反映给定的视觉场景中全局的深度分布趋势。4.不同于简单深度图视频估计直接将各帧深度图拼接成视频深度图序列,本文采取联合帧间空时关系的单目视频序列深度图估计。在单幅图像深度图估计基础上,引入时间相关性和运动约束项,共同构成视频深度学习的非参数模型。该方法能有效提升视频深度图估计中帧间深度连续性,抑制单目视频序列中运动物体的深度偏差。实验结果表明,针对未提供相机参数的单目视频序列,本文估计方法能获得场景结构明显、显著物体边界、物体位置相对正确且帧间较为连续的深度视频序列,以有效实现二维视频的三维转化。
其他文献
中医偏方是民间成百上千年传统国医的结晶,本文对内外妇儿几大科常见病中医治疗偏方进行了总结。
无线网络资源日益紧缺,降低码率、保证视频解码质量的编码系统是目前视频编码领域的研究重点。因此出现了将压缩感知视频编码和分布式视频编码结合在一起的基于压缩感知的分布
故障管理是网络管理五大功能模块之一,而故障定位是故障管理的核心。近年来,随着网络规模的急剧扩大,客观上要求能有一种故障定位技术投入商用,国外的各大电信厂商(HP、Bell
直接序列扩频通信系统因其扩频通信方式而具有较强的抗高斯噪声和宽带干扰能力、因其多址通信特征而具有大容量通信的能力、因伪随机噪声序列良好的距离分辨率而具有良好的测
传统信号处理理论指出,视频信号无失真恢复的前提是信号的采样频率要为待采样信号最高频率的两倍。这种视频采样方法将增加信号的采样复杂度。近年来出现的压缩感知理论打破了
目的:探析经腹彩色多普勒超声对老年结肠癌的诊断价值。方法:选取我院2012年3月至2014年8月57例疑似老年结肠癌患者,所有患者均采取腹部彩色多普勒超声诊断,将其临床诊断资料进行
目的:评估短种植体修复颌间距离过大病例的临床效果。方法收集下颌后牙缺失单冠修复的患者共28例,剩余骨高度3.8-7mm的患者,共植入Bicon种植体35枚,其中6mm长度种植体17枚,5.7mm
目的:探讨胎儿中孕期肝脏长度及面积大小。方法应用B型超声对140例胎儿的肝脏长度及面积进行测量,探讨胎儿中孕期肝脏长度及面积大小的正常值。结果胎儿中孕期肝脏长度及面积大
条件接收作为数字电视收费的必要的技术保障手段,随着数字电视产业的不断升温,市场需求也越来越迫切。本文在市场需求和公司要求的基础上,立足国内外相关CA 技术标准,并在理
生命科学与工程科学的相互交叉、相互渗透和相互促进是近代技术发展的显著特点之一,进化行为作为从生命现象中抽取的重要的自适应机制已被 人们普遍认识并得到了广泛的应用,