论文部分内容阅读
我们所处的真实世界与抽象世界的最大不同是其具有丰富的结构化信息,这种信息在人类视觉系统理解外部环境时发挥了重大作用。当人类观察图像时,他所看到的不仅是颜色和纹理,还有图像背后的世界。因此,计算机视觉算法也必须超越像素层面,对图像场景进行深入理解,研究图像中有什么、研究图像中目标之间的相互关系甚至图像的含义。这种理解带来的高层次知识可以被广泛应用于物体识别、虚拟现实、机器人导航和三维重建等领域,效果显著。
图像区域识别是场景理解的一个方面,能为其它应用提供丰富的先验信息。本文涉及一种基于统计学习理论的单幅建筑物场景区域分类与识别算法,其主要贡献包括以下几方面:
1.递进式的场景理解过程:首先用Mean Shift方法对图像进行过分割,得到超像素:再对相邻的、具有相似表观特征的超像素进行合并得到具有类别一致性的图像区域;最后用统计学习的方法得到每一区域的类别标号。这种方法可以从不同层次挖掘图像信息,使图像区域识别结果更好、更加鲁棒。
2.将物体表观特征与邻域信息(相邻区域的类别)相结合,利用上下文关系修正表观模型的判断结果,提高区域分类与识别的准确率。
3.条件随机场方法常用在多类别图像分割与识别中,其参数优化过程通常较为复杂。本文利用Adalboost进行条件随机场参数的隐式求解,降低了算法复杂度同时也保证了效果。
本文提出的方法具有一定的应用价值,从该结果出发,可以指导常见物体(如人、汽车)的识别,同时物体识别的结果也可以用来改善区域分类的精度。