基于高层图像语义的物体共分割

来源 :浙江大学 | 被引量 : 0次 | 上传用户：a954862

【摘要】

：

人类视觉系统不仅能够对图像中的颜色,纹理,光照和边缘等低层而抽象的图像特征进行感知,而且同样可以快速而准确地对其中物体的类别,尺寸,几何结构以及物体之间的空间布局关

【作者】

：

左文辉

【出处】

：

浙江大学

【发表日期】

：

2018年期

【关键词】

：

高层图像语义场景结构推理场景几何和语义标注物体共分割宽基线立体视觉

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人类视觉系统不仅能够对图像中的颜色,纹理,光照和边缘等低层而抽象的图像特征进行感知,而且同样可以快速而准确地对其中物体的类别,尺寸,几何结构以及物体之间的空间布局关系等更为高层而具体的图像语义实现推理。相比之下,基于计算机视觉技术的场景结构推理通常借助于经典的几何理论和图像处理技术,然而当遇到光照和物体遮挡等外部环境突变,相机发生较大运动变化,图像区域纹理较弱或存在众多重复性纹理结构等情况时,该类通常无法取得理想的结果。本课题针对如何利用低层图像特征来更为准确地挖掘出图像中包含的高层语义展开研究,并将应用到不同的室内外环境中,重点研究探索高层图像语义如何改善传统基于几何约束的场景结构推理的准确性和可靠性。本文内容和贡献如下:本文提出了一种能够适用于图像中同时包含多个前景物体且背景变化剧烈情况的无监督共分割算法。该方法能够通过对像素和区域的外观分布分别进行递归式建模来实现前景和背景的有效区分,并充分利用了图像内部以及不同图像区域之间的关联性来增加图像前景和背景模型的一致性。本文算法克服了以往方法存在的诸如需要图像间具有明显背景差异的限制。通过实验证明,和现有的经典方法相比当物体的姿态和相机视角发生变化或者物体发生形变时该方法依然具有更为鲁棒的性能。针对传统的前馈式视觉系统设计思路,本文提出了一种具有良好可扩展性的交互式算法框架以实现场景的几何和语义同步推理。该框架在经典的场景几何和语义推理基准算法基础上加入了多个辅助的视觉分析模块,上述模块不仅通过基于本征信息的上下文交互对推理得到的场景几何和语义信息进行递归式优化,而且不同的视觉分析模块也在交互过程中实现各自性能的提升。实验结果表明,这种基于本征信息交互的反馈式算法设计能够实现基准算法性能的渐进式改善。本文提出了一种新的思路,即同时利用场景的空间布局特性和物体之间的空间属性约束来实现室内杂乱场景的三维结构恢复。我们通过参数化地对室内场景和内部物体的空间体积进行描述,并且利用多种高层图像语义获取物体的先验信息,而且在此基础上加入了空间排他性和空间位置等几何约束,使得其有助于对场景空间布局的估计进行优化并且提供了更为丰富的物体描述。此外,上述几何信息同样可以为物体识别和最终的整体场景理解提供非常有用的关键信息。在本文中,我们仅通过少量的图像来实现室外大场景的三维模型重建。本文展示了在宽基线条件下如何将包含丰富信息的单目视觉特征与基于三角化的几何特征相结合以构建出精确的三维场景模型。本文方法采用马尔可夫随机场模型对每幅图像中各个超像素的三维位置和朝向进行同步推理,并结合多种高层图像语义信息对三维重建的过程提供有益指导。与此同时,还采用了一种递归的方式来实现场景深度和高层图像语义的联合优化。实验证明,本文方法在宽基线条件下能够取得比传统方法更为稳定和精确的三维重建效果。

其他文献

嗅鞘细胞移植对脊髓损伤大鼠的作用

目的探讨嗅鞘细胞（OECs）移植治疗脊髓损伤的作用及其机制。方法 Wistar大鼠30只,随机分为3组,每组10只。A组仅行脊髓损伤,B组脊髓损伤1d后移植OECs,C组脊髓损伤7d后移植OECs,移

期刊

脊髓损伤嗅鞘细胞细胞移植大鼠Wistar

土地置换和城市持续发展──以济南市为例

本文探讨了土地置换的理论基础、新形势下的动力机制及其对城市持续发展的重大意义，并结合济南市城区规划实践进行了实证分析．

期刊

土地置换城市产业结构动力机制济南市用地结构

试分析装配式模块化住宅在建筑设计方面的研究和应用

当前,随着我国经济发展速度的不断加快,建筑行业也得到了较为快速的发展。同时,经济发展速度的提升也无形中加快了人们的生活节奏,也促使我国建筑领域进一步提升了建筑设计水

期刊

模块化住宅住宅结构体系建筑设计研究和应用

基于机器学习的植被典型组件散射研究

植被是地物目标研究中最重要的一类,在太阳系的行星中,是地球所特有的重要特征之一。同时,植被是地球的水文和生物化学圈中不可或缺的一员,它与人类的生存和经济发展息息相关

学位

植被机器学习深度神经网络圆柱体组分双站散射极化散射

广州科学城科技人员公寓

期刊

广州科学城科技人员

非甾体抗炎药不良反应队列研究的样本量估计

目的:估算非甾体抗炎药不良反应队列研究的样本量,为临床科研设计提供依据。方法:根据研究目的及统计分析计划选择样本量的估算方法,多种估算方法相结合,提出几种方案以供决

期刊

非甾体抗炎药药物不良反应队列研究样本量

新型硬盒侧翻盖包装的设计

从吸烟卫生的角度出发,提出了用手从烟盒内抽取烟支时手与烟支过滤嘴端接触易沾染病菌的问题,为此对烟支与烟支包装问题进行了分析。借鉴烟盒上翻盖的包装型式,提出了卷烟侧

期刊

包装机侧翻盖硬盒包装设备改造

基于表面肌电信号的穿戴式人体行为识别系统

人体行为识别技术能够充分反映人体的运动情况和生理机能,对个体行为研究具有重大的参考意义。当前基于穿戴式传感器的人体行为识别技术受到了研究人员的广泛关注。与传统人

学位

人体行为识别表面肌电信号穿戴式系统支持向量机模式识别

依山而建傍林而居——杭州和家园规划与建筑设计

<正>1设计背景:杭州近郊的高端住宅在中国人的记忆之中,杭州一直是一个山水秀丽的宜居城市。多年以来,由于周边山区地形的限制,杭州城市版图始终没有在南端出现大规模的扩张

期刊

建筑设计户型设计居住小区立面造型保温隔热中南区高端住宅

等离子体作用下Mn掺杂ZnS量子点的掺杂能级荧光增强效应

掺杂型半导体纳米材料具有全新的光学性质,是当今纳米科学研究的一个热点。一般情况下,有些半导体材料的掺杂能级发光较弱,难以在实际应用中得到有效应用。金属纳米等离子体

学位

掺杂量子点ZnS密度泛函表面等离子体荧光增强

基于高层图像语义的物体共分割

与本文相关的学术论文