论文部分内容阅读
物体定位(Object localization)是计算机视觉领域一个基础的研究课题,它具有非常重要的理论意义和实用意义。目前的物体定位算法主要在像素级别进行。由于图像中的像素数量庞大,它具有运行速度慢、定位精度低的缺点。此外,由于目前的物体定位算法没有考虑噪声因素,它们在降质图像上的定位精度会大大降低。在本文中,我们研究如何在有雾图像中进行快速而准确的物体定位。针对有雾图像,我们首先将进行去雾处理,得到清晰图像后,我们使用一般的超像素生成算法得到超像素的集合,然后将这些集合中的超像素进行网格规则化,得到超像素级别规则的网格结构,最后,在这样的结构上,我们进行精确而快速的物体定位。围绕这一课题,文本的主要成果包括:(1)提出了局部反照率无关的单幅图像去雾算法,算法能够去掉传导率图像中不必要的细节而保留整体结构,恢复得到的图像更加自然。基于传导率图像,我们还恢复出深度图,并在单幅图像上实现了重聚焦、重光照等特效;(2)提出了基于全变分L1范数最小化的单幅图像去雾算法,它对不同各类的雾均能取得良好的结果;(3)提出了保持时空一致性的视频去雾框架,能够得到具有帧间和帧内连续性的清晰视频。此外,我们还将该框架应用至视频去噪上,同样也得到了良好的效果;(4)首次提出“超像素网格”的概念,并提出最大化整体相似性和最小化拓扑差异两种超像素网格规则化方法,可以将任意的超像素输入规则化为网格结构。在此网格结构上,定义好超像素的特征,人们即可像使用像素一样地使用超像素;(5)将在像素级别运行的物体定位算法扩展至超像素网格上,算法不仅在运行时间还是检测精度上,均明显高于目前最好方法。在实验中,为了验证所提方法的有效性和鲁棒性,我们在模拟数据集、现有数据集和扩展数据集上对相应方法进行定性、定量分析。从实验结果中我们发现,所提出的方法相比于对比方法,性能上有显著提高。