论文部分内容阅读
人类视觉系统的选择性注意机制可以帮助人类从复杂的外界刺激中筛选出场景中的重要内容,图像的显著性检测即是利用计算机视觉算法来模拟人类的这种视觉特性,快速定位图像显著性区域并给出其显著性程度,进而服务于其他图像分析任务。得益于传感器技术的发展,RGBD相机可以获取场景的可见光色彩信息和深度信息并以图像形式存储,为图像领域的研究注入了新的活力。本文从图像显著性出发,对RGBD图像的显著性检测与其在行人检测中的应用进行了较为深入的研究。论文的主要工作包括:(1)针对深度图由于获取设备自身局限性所带来的图像噪声问题,本文提出了一种基于卷积神经网络平衡深度图像细节的显著性检测方法:首先提取深度图像中的高层空间布局特征来忽略深度图像细节,再逐级渐进式嵌入彩色图像的特征来优化最终决策过程。方法综合了自底向上和自上而下机制的显著性特征,利用数据驱动的深度学习策略自动化地进行特征提取与融合决策过程。实验结果在公开数据集上取得了先进水平。(2)针对深度图像数据在不同特征层级对可见光数据的补充作用,本文提出一种基于残差补偿模块的深度信息辅助的显著性检测方法:残差补偿模块提取深度图像对彩色图像的补充信息,多层次的架构建模不同特征层级下深度图像数据与彩色图像数据间的辅助关系,预测模块结合多层级线索进行决策。实验结果表明了该方案处理RGBD显著性检测任务的性能良好,提取的显著性区域更为准确。(3)针对显著性检测在其他图像分析环节的应用问题,本文提出一种基于显著性检测模型抽取特征进行行人检测的方案。通过RGBD显著性模型提取并融合彩色图像与深度图像特征,利用简单设计的额外检测模块实现行人检测任务。显著性检测模型提取的特征包含丰富的视觉线索,基于公开数据集的实验证明了其具备直接迁移到行人检测任务的能力。综上所述,本文对RGBD图像显著性及显著性在行人检测任务中的应用方式进行了探索,为应对深度图像的局限性与多源信息的融合问题提出了相应的解决方法,并证明了显著性特征在行人检测任务上的应用价值。