强化边缘的单目图像深度估计

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wst6681
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决目前单目图像深度估计过程中物体边界处深度跳变不明显导致的遮挡难以判别、边界处深度估计准确度较低的问题,提出了一种强化边缘的单目图像深度估计方法。采用深度估计网络输出最初预测的深度图,同时采用深度补偿网络输出应补偿深度的预测值,通过融合两组网络的输出实现对最初预测的深度图中物体边界轮廓处深度值的补偿。此外,通过设计点约束损失函数,并引入多尺度特征融合损失函数进一步提升边界处的深度估计精度。在NYU Depth v2数据集和iBims数据集上的测试实验表明本文方法能有效提升深度图中物体轮廓的清晰度
其他文献
针对传统工况识别算法在识别有杆抽油系统工况时,存在生产措施调整滞后以及生产效率下降等问题,提出了一种基于改进的随机森林工况识别算法.采用灰度矩阵特征提取算法对泵功图进行特征提取,将灰度特征值通过合成少数类过采样技术进行上采样,实现不平衡数据均衡化;利用蜻蜓优化算法选取随机森林参数对抽油机井工况进行识别,并以辽河油田的生产数据进行实验验证.结果表明,该方法能够避免传统识别方法选取参考工况不准确的问题
期刊
交通标示识别在自动驾驶领域有着广泛的应用前景。在实际场景中,光照、地理位置、检测方法等因素会对较小交通标示识别产生影响,导致识别精度降低。针对这些问题,提出一种新型多尺度融合卷积神经网络模型(SFRCNN)。首先在基础特征提取网络中加入多尺度空洞卷积池化金字塔模块(Multi-scale AtrousSpatialPyramid Pooling,MASPP),在多尺度空洞卷积采样后,不改变每一个特
期刊
为了实现对隐藏在散射介质后方的静态目标物体的高分辨率重构以及动态目标物体的重构和实时追踪,避免利用旋转毛玻璃产生赝热光源的不可预置性和机械振动对成像质量的影响,将空间光调制器应用到散斑相关成像系统中来产生赝热光场,对静态目标成像以及动态目标追踪进行了实验研究。其中动态目标追踪的偏差率在很小的范围内,最小可达0.38%。在图像重构过程中,采用基于扫描近似信息传递的相位恢复算法来提高运算速度和图像鲁棒
期刊
针对同轴数字全息中零级像及孪生像对再现像干扰的问题,提出一种基于深度学习的单帧同轴数字全息图重建方法。利用神经网络强大的特征提取能力,去除同轴全息重建过程中零级像及孪生像对再现像的干扰。分别针对强度型和相位型目标所对应的同轴全息图利用U-Net的卷积神经网络进行了训练和重建,结果表明U-Net网络对强度型和相位型目标均能实现高质量的重建。为进一步验证该网络对不同类型目标的泛化性,将字母数据集生成的
期刊
针对烟雾分割领域缺乏应用于实际监控系统的实时烟雾分割算法的现况,提出高准确率的实时烟雾分割算法.该算法利用轻量化的多分辨率卷积模块并行提取特征图,在获得丰富语义信息的同时满足实时分割的需求.提出烟雾前景增强模块,使得烟雾像素点融合前景增强表征、避免背景信息干扰,分割准确率得以提高.提出残差注意力模块,从通道、空间维度增强重要特征信息,抑制无效信息.该算法在自建数据集上平均交并比为91.27%,每张
期刊
以石嘴山地区碱性土壤为研究对象,全面采集了石嘴山地区表层土壤样品,分析了土壤中硒及有效硒等地球化学指标。结果表明:研究区土壤硒的主要来源为贺兰山区黑色岩系,其次为引黄灌溉淤积;研究区硒的生物有效性处于较高水平,有效硒富集及以上的区域占全区的79.2%,面积约为777.2km~2;硒不同形态含量依次为残渣态>强有机结合态>腐殖酸结合态>离子交换态≈水溶态>碳酸盐结合态≈铁锰氧化物结合态,全硒含量有限
期刊
为了提高单目视觉相机的测量精度及测试数据的可重复性,提出了一种应用于激光扫描投影中扫描镜的闭环控制方式来提高投影出的条纹位置的稳定性。利用集成在扫描镜上的压阻传感器提供的反馈信号进行闭环控制,同时针对压阻传感器的温度特性,设计了测试系统来标定压阻输出与温度关系曲线。通过记录每一个温度下压阻的反馈输出值,生成反馈输出与温度的关系表。在室温至70℃的温度区间内,扫描镜的扫描角度的变化量由3.52°减小
期刊
目的 提出一种基于深度学习技术的赤足足迹图像人身识别算法。方法 以ResNet50为基础网络,结合水平金字塔匹配(horizontal pyramid matching, HPM)技术提取赤足足迹图像的多尺度特征,并利用三元组损失函数SeparateTripletLoss对赤足足迹进行人身度量学习。结果 本文基于6433人的赤足足迹进行训练,在11028人的开集赤足数据集上进行测试,所提出的算法的
期刊
现有的风格迁移算法大多是实现艺术作品到真实场景,如照片等的转换任务。在这种任务设定下,图像内容的边界等结构信息可能会出现一定程度的变化,然而这种变化不利于下游任务的完成,因而不适用于大部分工业场景。为此提出一种新的结构保持的风格迁移方法,该方法分为频域约束的图像生成模块和基于memorybank机制的语义匹配模块。前者用以保证转换前后图像的整体语义结构一致性,而后者保证了图像的语义与风格匹配,从而
期刊
为快速准确计数大豆籽粒,提高大豆考种速度和育种水平,本研究提出了一种基于密度估计和VGG-Two(VGG-T)的大豆籽粒计数方法。首先针对大豆籽粒计数领域可用图像数据集缺乏的问题,提出了基于数字图像处理技术的预标注和人工修正标注相结合的快速目标点标注方法,加快建立带标注的公开可用大豆籽粒图像数据集。其次构建了适用于籽粒图像数据集的VGG-T网络计数模型,该模型基于VGG16,结合密度估计方法,实现
期刊