论文部分内容阅读
图像理解是一门从图像中自动获取信息的科学,其主要的技术包括图像分割,图像成份的建模,图像分析及推理。该领域的研究包括了开发图像(户内/室外,人,脸,树,大楼,等等)目标特征的自动提取方法以及实现图像解释的有关方法,这对诸如图片的数据库管理或自动建立是非常有益的。图像理解是人工智能中涉及基于输入图像解释来做出决策或完成一些控制系统的主要环节,其在医学和国防等领域中有着广阔的用途。 本文在总结近几年研究成果的基础上,给出了一个图像理解的基本框架结构,并对各部分的具体功能及实现进行详细的分析,文中对图像理解的研究主要分为六个部分。具体是:第一部分着重探讨图像理解方法,在这一部分中首先对当前有关的视觉感知理论进行介绍。简要地回顾低级视觉过程对目标的识别的作用,如从阴影或纹理中感知结构等,其主要目的是集中讨论图像理解方法。并对有关理论的生物学似然性进行了评定。这些来自心理的研究证据对不同的计算模型有着不同的结论,它们或支持于或矛盾于计算模型。除此之外还给出了最近有关生理学的研究成果,这些研究结果表明大脑中的3D信息处理是一个层次型的结构模式。第二部分主要涉及图像分割技术的实现,其主要用来检测目标的边界。重点给出了边缘检测后的再分割算法以及对分割后结果的评价分析方法;创新地提出了基于视觉感知的分割思想。第三个部分主要研究形状表示和分析的各种技术。形状的表示方法或基于边界(边的边之间的关系描述)或基于区域(利用边界检测算法生成的闭合区域)。这一部分主要给出了边界形状分析方法的回顾及链码表示技术。第四部分集中于理解技术与有关知识表示技术的集成以及感知推理方法的研究。第五部分讨论有关图像理解中基