基于深度估计的物体分类与检测技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:kiujiabing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术及经济社会的发展,计算机视觉技术在很多领域得到了广泛的应用。物体分类与检测技术作为计算机视觉研究中的基本问题,是场景识别、动作识别、人脸识别等其他视觉任务的基础。本文在分析现有物体分类与检测技术的基础上,发现了基于RGB图像的方法由于二维数据固有的局限性,缺乏实际三维场景的深度信息,易受光照、物体尺度变化等因素的影响,而基于RGB-D图像的方法虽然弥补了二维图像识别方法的不足,但在实际测试时却需要深度传感器来采集真实深度信息,并且传感器本身测距范围有限等局限性也限制了RGB-D方法的应用。本文基于单目深度估计的方法,将深度估计得到的深度信息引入到现有物体分类与检测模型中,以提升现有方法的识别性能。本文的主要研究工作包括:(1)提出了一种基于单目深度估计的物体分类与检测方法,使得模型在实际测试时,仅需RGB图像输入,无需深度传感器引入深度信息,就可以提高现有分类和检测算法的识别性能。(2)针对于现有单目深度估计算法在细节重构上的不足,提出了一种基于特征金字塔网络的深度估计模型,使用像素重组模块提升上采样过程中的特征提取能力,使用残差池化模块使得网络能够充分利用上下文信息,并且设计了一种同时考虑深度、梯度和表面法向量三种几何意义的损失函数。在公开数据集上的对比实验表明,所提出方法能够在更少参数占用与更快运行速度的情况下,获得良好的深度估计结果,并且对于场景的结构细节具有更好的重构效果,更有助于后续分类检测任务的性能提升。(3)将深度估计模型引入到现有物体分类检测模型中,探究网络初始化方法、融合位置等融合策略的选择,并且采用多任务学习的优化方式,联合优化深度估计模型与分类检测模型,使得深度估计模型能够在训练中接收识别任务的语义引导,生成更有利于分类检测任务的深度图。在公开数据集上的对比实验表明,本方法能够有效提升模型的分类检测性能。同时在不含有真实深度图的数据集上进行了泛化性分析,实验表明本文方法在自然图像上具有良好的泛化性能。
其他文献
随着信息处理技术、数据采集技术的不断发展和大数据时代的到来,人们可获得信息的途径越来越多,信息量也越来越大。鲁棒主成分分析模型作为高维数据降维的有效方法之一,在图像处理领域中应用广泛。本文将主要研究鲁棒主成分分析模型的改进及其在视频前景背景分离问题中的应用。论文的主要工作如下:首先,对鲁棒主成分分析模型的基本原理及国内外研究现状进行了介绍,同时对本文中用到的模型求解算法进行介绍,并给出了算法的基本
2015年5月15日,阿里巴巴集团在美国因涉嫌商标侵权而遭到法国开云集团起诉引起各界对于电子商务平台提供者商标侵权责任认定问题的高度关注。电子商务在我国发展迅速,其在给
山崎丰子是日本社会派的代表作家。她在取材翔实的基础上,创作了众多战争题材的作品,塑造了许多经典的男性形象。自20世纪70年代起,在日本社会战争体验急速淡化的背景下,创作了“战争三部曲”——《不毛地带》(1978年)、《两个祖国》(1983年)和《大地之子》(1991年)。本论文以“战争三部曲”为研究对象,运用文本分析的方法,通过对男性形象的分析,考察“战争三部曲”中的战争观。本研究选取三个角度进行
等规聚丙烯(i PP)具有优异的物理性能、优异的耐化学性、较轻的重量和可回收利用的特点,尤其具有良好的经济效益,是一种重要的高分子材料。然而,功能基团的缺乏导致聚丙烯表面性能差,附着力差和与其它聚合物的相容性差的问题,严重限制了聚丙烯材料的一些高附加值应用。因此,在聚烯烃骨架中引入极性官能团,以满足高附加值的特殊应用所需的材料性能,是目前一个十分热门的研究方向。具体研究内容如下:1、使用过渡金属催
聚落的道路景观与传统农业生产、生活密切关联,有着独特的农耕文化基础。南靖土楼聚落是南迁客家人不断适应闽西南山区自然条件,同时融合当地土著的生存智慧所成就的农业聚居点,形成了独特的聚落道路景观。随着南靖土楼被列入世界文化遗产名录,遗产保护捆绑的旅游开发彻底改变了世遗土楼群所在的河坑村的聚落。虽说目前的聚落道路基本保留了原有线形,但道路景观中蕴涵的文化内涵被彻底改变,相关历史要素正逐步消失,同时引发了
随着经济的迅速发展,人民生活水平不断提高,信用卡的发行量也与日俱增,客户违约支付的风险随之增大。传统的风险评估方法已不能满足现状,基于此本文针对如何实现信用卡违约客户的高查准率和高查全率识别展开了探讨。本文首先调研了信用卡行业发展现状和信用卡风险识别研究现状,分析了机器学习在信用卡风险识别中的应用和优势,然后利用传统机器学习单模型和混合模型分别建立了客户违约支付预测模型。在模型的建立中通过删除重复
近年来,各大高校纷纷建立英文网站,希望能更好地迈向国际化,与国际社会更有效地进行交流。天津大学英文网站在天津大学国际交流中发挥着重要作用,是国际社会了解天津大学的重要门户,也是天津大学向世界展示自己风采的重要平台,因此对英文网站上的新闻进行准确得翻译对有效交流起到至关重要的作用。本实践报告应用纽马克的交际理论来指导新闻翻译,希望在前人研究的基础上,进一步深入,促进交际翻译理论在新闻翻译中的研究的发
山茱萸为常见药用植物山茱萸(拉丁名为Cornus officinalis Sieb.et Zucc.)干燥成熟深红棕色果肉。常被医书典籍记录为山茱萸能补肝肾、固脱精气,用于治疗头晕耳鸣、腰酸膝软
当今,我国城乡一体化进程不断加快,社会发展形势日渐更新,社会结构逐步调整,人们对社会管理的要求也越来越复杂,原有的工作方式、管理职能和组织形式已不能作为党和政府与人
随着互联网的发展,业务在种类上呈现出多样化,在数量上呈现出猛增趋势,节点的结构和功能影响着整个网络的性能。传统的节点既要完成底层的交换,又要进行路径的计算和波长的分