论文部分内容阅读
图像理解是一门介于计算机视觉和人工智能之间的交叉学科,它是研究用计算机系统解释图像,实现类似人类视觉系统理解外部世界的一门科学。图像理解主要是通过图像处理的方法从图像中获取到目标物体的信息,然后结合关于特定场景的知识完成对图像中的场景解释。它具有重要的理论研究意义和广阔的应用前景。自上世纪实际八十年代提出Marr视觉理论以来,图像理解得到了很大发展。图像理解具有鲜明的层次性,中高层算法涉及到区域分割、目标识别和图像解释等内容,是图像理解中非常重要的部分。本文讨论了图像理解的中层和高层处理中使用的技术。在中层的图像分割方面,虽然人们提出了数以千计的图像分割算法,但是到目前为止还没有一种通用的算法。FCM(Fuzzy C-Means,模糊C方法)算法具有能适应图像中目标边界模糊的特点,为了克服其计算量大等缺点,提出了一种HSL颜色空间下基于二维直方图的FCM聚类彩色图像分割算法,通过二维直方图初始分割给FCM方法提供较好的初始值有效的减少了FCM算法迭代的次数,加快了算法的收敛。在高层处理的目标识别方面,常规的模式识别算法常常要面对图像中信息不完全和场景中的目标模式不确定等问题,为此提出了基于遗传算法的属性图目标识别方法,将统计/几何特征和场景中目标之间的先验位置关系加以结合,构建属性图和模糊规则,然后通过遗传算法进行搜索,从而到达对图像中目标的最佳识别效果。Robocup是国际RoboCup联合会组织的机器人世界杯,它的举行推动了机械、电子、控制、模式识别、图像处理和人工智能等多个领域的技术发展。中型组的比赛是其中一项具有代表性的比赛。中型组足球机器人一般决策系统、视觉系统、运动控制系统和无线通信系统四部分组成,其中视觉系统是获取场地信息的唯一来源,对比赛非常重要。它就是一个典型的图像理解系统。本文从图像理解的三层处理技术角度对Robocup中型组机器人视觉系统的图像处理过程进行了描述,采用了灰度变换和高斯低通滤波对图像进行预处理;使用前述的分割方法对图像进行分割,并提取了目标的颜色和形状特征;对前述的目标识别方法做了简化之后采用它完成了目标识别;最后将目标的信息传递给决策系统。系统在2007年的Robocup公开赛中表现出良好的性能。