RGB-D图像内容分析关键技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：lxh5310

【摘要】

：

RGB-D媒体获取设备的发展、普及使得RGB-D数据持续增长,极大地推动了多媒体研究领域中RGB-D媒体数据相关处理技术的研究。其中,RGB-D图像内容分析是针对RGB-D图像进行一系列

【作者】

：

徐向阳

【出处】

：

南京大学

【发表日期】

：

2018年期

【关键词】

：

RGB-D图像深度图像多模态特征学习似物性估计对象检测场景识别图像内容检索高维特征索引的创建与查找

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

RGB-D媒体获取设备的发展、普及使得RGB-D数据持续增长,极大地推动了多媒体研究领域中RGB-D媒体数据相关处理技术的研究。其中,RGB-D图像内容分析是针对RGB-D图像进行一系列特征分析、语义理解以及智能认知的技术,会给人们的学习、工作和生活带来诸多便利,具有广阔的应用前景和潜在的经济价值与社会价值。当前的工作主要是以分析传统RGB图像的方式来分析深度图像,而较少关注RGB-D图像数据自身特性的挖掘和利用。本文从分析RGB-D图像的内在特性入手,围绕RGB-D图像的层次化语义内容分析技术展开研究,充分挖掘RGB和深度图像间的差异性和相关性,以优化RGB-D图像内容分析的效果,从而为分析、处理和应用RGB-D图像数据提供一系列关键支撑技术。在本文中,我们的主要工作和贡献包括以下几个方面:1.提出了一种颜色与深度信息自适应融合的似物性估计方法,充分发挥多模态数据的优势,有效提升现有方法的估计效果和处理的稳定性。RGB图像中的似物性估计易受高纹理区域的干扰,而深度图像提供了较为清晰的对象边缘,十分有利于似物性分析。但是,深度图像会随着深度增加,描述能力迅速衰减。通过考察RGB和深度图像各自的优势,本文提出了一种自适应融合RGB和深度信息的对象描述方法,充分利用颜色和深度线索来进行似物性分析。有效地区分了 RGB图像中的歧义区域,特别是高纹理区域,同时,强化对象边界轮廓区域,最终获得更鲁棒的特征描述来度量窗口的似物性。该方法不仅具有更高的召回率,也表现出了更好的稳定性。此外,本文还公布了一个基于双目立体图像的似物性估计数据集,以推动本领域的相关研究。2.提出了一种用于RGB-D图像对象检测的多模态深度特征学习方法,有效挖掘RGB-D对象的模态特有的和模态相关的特征表示,显著提升了对象检测精度。现有的用于RGB-D图像的对象检测方法,通常是将RGB图像中的对象检测方法直接作用于深度图像,未能有效地挖掘两种模态间的相关性特征。本文基于RGB和深度图像的语义应具有相关性的认知,提出了一种用于学习RGB-D图像模态相关特征的方法,同时融合模态特有特征构成更全面、更有效的多模态特征表示。在两个国际上公开的RGB-D图像基准数据集上的实验评测表明,本文的特征描述方法可以探索RGB-D对象的不同层面,有效挖掘了其互补多模态特征表示,而且能够更快速、精确地得到RGB-D图像的似物性估计和对象检测结果。3.提出了一种基于图像到图像翻译模型的RGB-D图像场景识别方法,自动挖掘RGB和深度图像间的联系,大幅提升场景识别精度。鉴于目前RGB-D图像数据集规模较小,现有的RGB-D图像场景识别方法通常需要利用在大规模标注的RGB图像集上预训练好的模型来对深度模态的识别网络进行精调,这将会导致学习到的深度模态特征存在一定的偏置,而且没有有效探究场景视觉外观和场景空间结构布局之间的关系。本文在不依赖任何额外标注数据的情况下,直接从基于图像到图像翻译模型的RGB-D图像生成模型出发,在学习生成高质量RGB-D图像的同时,自动地对两种模态图像间的关系进行建模,为后续的场景识别预学习到了含义更丰富的RGB-D图像表示。在两个国际上公开的RGB-D图像基准数据集上的实验评测表明,在不使用任何额外标注数据的情况下,本文方法获得了非常有竞争力的场景识别精度。此外,本文的场景识别方法还可以适用到跨模态的场景识别,能够显著提高单模态下的场景识别精度,有着更广阔的应用前景。4.提出了一种针对双目立体图像的对象检索的框架,充分发挥深度信息在显著对象提取中的作用,有效减少无关背景区域对于图像内容检索的影响。为了更方便地浏览、组织、管理与日俱增的双目立体图像媒体,本文在对象检索基础上,提出了一个完整的基于对象的双目立体图像检索框架。通过结合双目立体图像中恢复出的深度信息,提出一种可以自动检测出图像中关键(显著)对象的方法,从而构建对象级别的图像索引,弥补了现有基于对象的图像检索方法的不足。同时,本文还将传统的位置敏感哈希算法拓展成分布式索引方法,提高了检索效率。实验评测表明,本文方法可以有效地检测出图像中显著对象区域,而且检索过程更加高效,结果更加精确。在此基础上,本文公布了一个双目立体图像检索数据集,以推动相关领域的研究。

其他文献

误差与测量的关键数据评定在长度计量检定与校准中的应用研究

长度计量技术是研究长度测量、保证量值准确和测量单位统一的技术。文章主要介绍长度计量检定与校准中误差与测量不确定度的分析意义和分析原则,并对误差分析、测量不确定度

期刊

误差测量不确定度长度计量温度影响

把好市场主体入门关加大企业监管力度——国家工商总局企业注册局局长许瑞表访谈录

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

国家工商总局企业登记注册企业登记管理

高职院校汽车营销与服务专业的人才培养

新形势下,中央提出经济双循环的发展思路,高职汽车营销与服务专业承担着培养汽车营销和服务类专业技能人才的重任,在促进国内汽车消费中起着重要的作用。其人才培养模式应随

期刊

经济双循环汽车营销与服务人才培养创新double cycle of economyautomobile marketing and serviceper

西丰杨系列品种简介

介绍了西丰杨系列品种选育过程,西丰杨具有生长快、抗病能力强等优良特性,建议西丰6、西丰18、西丰17、西丰21可在海东川水地区推广应用,其他品系可在区试后逐步推广。苗木高

期刊

西丰杨无性系品种选育基地建设区域试验苗木粗度指标Poplar Xifeng Poplar Clones Improved varietybreedi

优质护理在外周静脉留置针操作中的应用体会

<正>静脉留置针穿刺留置技术作为一种临床实用操作技能,在提高输液质量方面发挥了极大作用,因操作方便,易于掌握,满足临床治疗需求,有效提高工作效率及护理质量。护理人员不

期刊

静脉输液静脉留置针优质护理

浅谈进行整体护理干预对糖尿病患者遵医嘱行为的影响

目的 :探讨进行整体护理干预对糖尿病患者遵医嘱行为的影响。方法 :对2014年3月~2015年6月期间我院收治的90例糖尿病患者的临床资料进行回顾性研究。我们将这90例患者随机分

期刊

整体护理干预糖尿病遵医嘱行为

优质护理在子宫肌瘤围术期应用价值

目的:探究优质护理在子宫肌瘤患者围手术期中应用的护理价值。方法:将2016年7月-2019年7月在本院接受治疗的200例子宫肌瘤患者作为观察对象,经过随机分组法分为两组(观察组和

期刊

优质护理子宫肌瘤围手术期护理护理质量Quality nursingUterine leiomyomaPerioperative nursingNursi

配音艺术的突破和创新——以《再说长江》为例

“配音”是影视理论中的一个专有名词，也是一个概念。从字面上看似乎很简单：为画面配解说，为画面配音乐，为画面配音响。从这一点来看，“配音”的由头是画面，依据的也是画面，目的还是

期刊

《再说长江》同期声再说长江影像语言配音艺术

海南州农林科学研究所简介

海南州农林科学研究所成立于1959年9月，兼有州农业技术推广站和州种子管理站的业务，是“三块版子，一套人马”的综合性公益农业科技服务单位。现有职工25人，其中专业人员10人，高级

期刊

科学研究所海南州农林农业技术推广站农业科技服务种子管理站农艺师实验基地

农业机械技术推广中存在的问题及应对策略探究

在农业生产发展的过程中,相关科学技术的引入和运用是非常必要的,其中农业机械技术就是一项重要的农业技术,需要确保推广工作的扎实有序推进,实现良好的推广工作效果,真正借

期刊

推广人员农业机械技术农业生产发展教育力度问题及应对策略创新推广有序推进综合素质

RGB-D图像内容分析关键技术研究

与本文相关的学术论文