论文部分内容阅读
计算机视觉主要研究对象是如何利用计算机实现人的视觉功能,即利用二维投影图像实现对客观世界三维场景的感知、识别和理解。自然界的一切景物在空间上是三维的,在状态上是运动的(静止只是相对的),所以对计算机视觉的研究和应用从根本上来说应该是三维的和动态的。现有的大多数图像采集装置所获取的图像本身是二维的,尽管其中可以含有三维物体的空间信息。要从图像认识世界,就要从二维图像中恢复三维空间信息。 深入开展计算机视觉的研究,不仅是为了满足人工智能应用的需要,即用计算机实现人工的视觉系统的需要,使计算机和机器人能够具有“看”的能力;而且计算机视觉的研究结果反过来对于人类进一步认识和研究自身视觉系统本身的机理,也同样具有相当大的参考意义。 计算机视觉的研究内容主要包括图像输入设备、低层视觉、中层视觉、高层视觉和体系结构等五个方面。本论文的主要工作就是针对其中有关图像输入设备、低层视觉中的边缘检测、中层视觉中的立体视觉和二维运动估计等课题,根据这些领域目前存在的一些问题进行了深入的研究,力图在实现技术和算法改进方面上有所突破和创新。 在图像输入设备和技术的研究方面,在借鉴前人研究成果的基础上,本文研究了环形编码显微镜——一种新的光电成像装置的制备方法和相应的图像恢复技术。该装置基于编码孔径成像技术,具有较高的空间和时间分辨率,特别适合于X光条件下成像。 在边缘检测技术的研究方面,本文提出一种新的边缘特征检测方法。该方法在重新定义边缘特征的基础上,引入模糊推理理论,从而形成了基于多边缘特征和模糊推理的边缘检测方法。该检测方法具有较好的抗噪声性,且对模糊边缘也有较好的检测效果。 立体视觉主要研究如何借助(多图像)成像技术从(多幅)图像中获取物体的距离(深度)信息。一个完整的立体视觉系统可分为图像获取、摄像机校正、图像特征提取、立体匹配、三维信息恢复和后处理等模块。其中,立体匹配是立体视觉研究中的难点和重要内容。在立体匹配算法的研究方面,本文主要研究了分别基于改进的遗传算法和小波变换的两种匹配算法。两种方法都可实现较好的匹配结果。 为了满足人们对自然场景更全面理解的需求,有关动态场景分析的研究也是计算机视觉研究的热点之一,其中作为动态场景分析基础的二维运动估计方法的研究也显得格外重要。二维运动估计就是根据二维图像序列估计景物运动、提取运动参数、分析景物的运动规律等。本文提出通过计算图像序列帧间的光流变化来修正Snskes动态轮廓模型,从而成功实现对二维运动目标轮廓的成功估计和跟踪。 此外,本文还在遗传算法的算法改进方面作了一定的研究工作。