基于深度学习的光场深度估计研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:yj700702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度估计是计算机三维建模、自动驾驶等计算机视觉应用的关键步骤,其目的是获得目标与相机之间的距离,输出深度图。不同于传统相机成像过程,光场相机同时捕获入射光线的亮度和角度信息,只需单个镜头一次曝光就可得到4维光场信息。基于双平面表示方法,光场信息可表示为一组存在视差的子光圈图像阵列。光场深度估计就是一种以子光圈图像阵列作为输入的深度估计方法,它可以更鲁棒地解决无纹理、遮挡、噪声等传统深度估计方法所面临的问题。卷积神经网络具有很强的深度表征和拟合能力,本文将光场深度估计量化为一个卷积神经网络所擅长的分类问题,分别提出了 EPN、SOA-EPN、EPI-Refocus-Net三种卷积神经网络结构,所提出的这三种结构是递进发展的关系,它们解决无纹理、遮挡、噪声等问题的能力逐步提升。EPN是一个基于EPI(epipolarplaneimage)分析的卷积神经网络,它以水平、垂直两个方向的EPI图像作为输入,采用孪生网络结构分别提取这两个EPI图像的深度特征并进行特征融合,最后预测输出视差图。EPN在4D光场评测网站上排名第3(2017年4月的网站排名)。为进一步提高深度估计精度,提出了尺度、方向自适应的EPN网络:SOA-EPN。SOA-EPN在EPN网络结构的基础上,提出以多方向EPI图像(水平、垂直、45度和135度)作为网络输入的方法,同时采用尺度自适应选择网络ASSN、四分支共享权值网络、多层交叉熵损失函数等技巧提升了 EPN在无纹理、遮挡区域的精度。SOA-EPN的误差均值相对于EPN降低了 3.7个百分点,在4D光场评测网站上排名第2(2018年1月的网站排名)。EPI-Refocus-Net是一个融合了 EPI线索和光场重对焦线索进行深度估计的卷积神经网络,它基于SOA-EPN,使用高、宽、深三个维度独立卷积以及引入中心子光圈图像作为参考等技巧提升了 SOA-EPN在无纹理、噪声区域的精度,弥补了 SOA-EPN抗噪能力弱的短板。EPI-Refocus-Net的误差均值相对于SOA-EPN降低了 2个百分点,在4D光场评测网站上排名第3(2018年12月的网站排名)。
其他文献
编者按计量测试技术是所有实验科学和工程测量领域中必不可少的环节,用于合理表征设备指标和系统性能,评价测量结果,为其他技术提供支撑。伴随着我国航天事业的发展,航天系统
目的:观察利咽开音茶与遏云茶配合治疗声带小结的临床疗效。方法:采用随机对照试验,将60例声带小结患者随机分成2组,治疗组给予利咽开音茶与遏云茶治疗,对照组给予黄氏响声丸治疗
<正>大气的教学楼、浪漫的咖啡馆、别致的艺术楼,步入有"中职最美校园"美誉的宁波外事学校校园,一股浓浓的"国际范儿"就扑面而来。作为国家中等职业教育改革发展示范校、国家
药物残留已成为影响中国水产品质量安全的重要因素。近年来的监测结果发现,禁用药物尤其是硝基呋喃的残留在某些品种上有明显上升的趋势。本文通过分析硝基呋喃在鳜、乌鳢、
在当今社会经济发展下,企业面临的经济环境越来越恶劣,竞争日益激励,企业若要取得长远生存发展空间,必须依靠新产品的开发和推广,通过新产品的推出保持市场的占有率。新产品
随着人民币国际化的推进和跨境人民币规模的快速增大,实施本外币一体化监管变得愈发重要和急迫。本文对跨境人民币政策演进和业务现状进行了分析梳理,对现行本外币政策差异和
直译和脱离语言外壳是口译员常用的两种翻译策略。直译是在口译中忠于原语中的词句含义和形式结构,脱离语言外壳认为口译员不应当受到原语的形式的束缚。但是,错用直译策略会导致望文生义的问题,错用脱离语言外壳策略会造成原文的信息和风格丢失,两种策略错用会对译语造成负面影响。笔者通过对具体的汉俄交传案例分析,讨论了两种策略错用问题在逻辑、背景知识、笔记使用方面上的原因,详细分析了案例出现的错误。笔者针对这些错
应用液相色谱-串联质谱(LC-MS/MS)测定养殖水体中孔雀石绿的含量。水样经二氯甲烷萃取浓缩,以1 m L50%的乙腈-乙酸铵溶液定容,采用液相色谱-三重四级杆串联质谱仪多反应监测
本人从事塑料技术工作二十多年.经过数年的市场研究与反复试验.现已成功发明并申请专利“翻盖式PVC阻燃线槽”。
期刊
猪源多杀性巴氏杆菌(Pasteurella multocida,P.multocida)是猪肺疫和猪萎缩性鼻炎的主要病原,能给生猪养殖行业造成重大经济损失,而通过接种疫苗是防控该病的一种重要手段。