论文部分内容阅读
众所周知,图像是人类获取信息的重要媒介,图像相对于文本、声音等其他信号包含有更为庞杂的信息,要从海量的图像数据中找到有用的信息是一件代价较高的事情。为了能够解放人的视觉系统,必须发展对应的机器视觉。目标的自动检测与识别是计算机视觉的重要分支,随着目标识别技术的发展,有很多成功的应用已经用于工业生产、智能交通、视频监控、半导体制造、医疗诊断、智能导航以及日常社会生活等领域中。尽管我们可以举出大量的目标识别算法成功应用的实例,这并不意味着目标识别算法已经趋于成熟,恰恰相反,目标识别目前还并没有普遍适用的解决框架和理论架构,在理论上和技术上均存在着众多挑战。从理论角度而言,目标识别算法的理论框架还处于探索之中,由于人类的视觉系统过于复杂,目前还不可能对人类视觉系统进行比较好的模拟,学术界在视觉理论的探索上还有很长的路要走。在应用领域,实时性和鲁棒性是目标识别系统面临的两个主要难题,尤其是复杂场景下实现鲁棒稳定的目标识别还是一个悬而未决的问题。本文的主要任务是,研究复杂成像环境(如水下成像以及恶劣天气下成像)下人造目标的检测和识别技术。人造目标一般有着明显的纹理、颜色或形状特征,然而在复杂成像场景下,这类特征在成像过程中会遭受不同程度的破坏,比如在水下环境中,由于水对光线的吸收和色散作用,目标很容易发生色偏,此外在噪声严重的环境中,目标的轮廓也容易发生断裂或不可见。本文针对此类问题,设计了一个复杂成像环境下的特定目标识别算法框架,该框架遵循“目标区域检测-目标区域优化-目标识别定位”的递进式流程。具体而言,本文在以下几个方面做了工作:1.针对水下图像的高噪声以及目标在水下环境中严重的色偏问题,提出利用均值漂移滤波算法和基于图像广义均衡模型的色偏矫正算法进行图像预处理。通过图像的预处理,在抑制噪声的同时,部分地恢复了图像的颜色等重要特征,为后续的目标检测与识别提供了重要保障。2.提出了一种基于颜色通道比值的图像变换技术,颜色通道比值变换具有一定的光照不变性,能够很好的抑制噪声并去除阴影。同时颜色通道比值变换结合k-means算法,可以在统一的参数配置下实现快速高效的目标区域提取。此外,针对复杂成像环境造成的目标轮廓信息的损坏,基于颜色通道比值图像进行边缘提取,能够很好地提取出目标的边缘。3.为剔除目标兴趣区域检测过程中造成的误检测结果,提出了一种基于外轮廓提取和漫水填充的兴趣目标区域优化算法。同时,在目标识别阶段,本文基于距离变换和方向倒角匹配算法实现了一种对目标尺度变化以及形状微小畸变具有不变性的形状匹配算法。形状匹配是一种扫描窗式的匹配算法,一般情况下有着较高的运算复杂度,为了提升算法性能,文中引入三维距离变换、边缘点的分段光滑线段表示、距离变换积分图以及区域搜索优化策略等方法对形状匹配算法进行了不同层面的优化。4.根据项目的需要,本文将上述所有算法基于C++和OpenCV开发为一种特定目标的检测识别与跟踪系统,实现了对特定目标的全自动检测与跟踪。