论文部分内容阅读
基于视频图像的运动目标识别与检测是计算机视觉研究的一项重要内容,在军事目标识别和跟踪、工业动态监视、医学细胞运动的研究、气象学中的云层跟踪、交通管理中的交通监视、机器人控制等领域中都有应用。因此,实现可靠、自适应、快速的运动目标检测和识别就有着非常重要的意义。
本文对基于视频技术的运动目标检测和识别进行了研究。在研究分析了目前流行的算法和理论之后,就运动目标的背景提取、目标检测和识别的理论和算法开展了研究,提出了基于高阶统计量的静态背景提取理论,基于不变性变换的目标检测理论,基于组合神经网络算法的目标识别理论等。本文的主要贡献在于改进了这些理论,并提出了一些新的结构和算法。
本文提出的采用视频技术的静态背景提取算法利用二维图像的高阶统计量的固有特性,通过若干个连续或者不连续的图像帧,在有运动物体的情况下提取出静态背景,然后将后续图像帧和已提取出的静态背景帧进行差分,实现目标提取。这种算法可以解决帧间差分方式无法同时满足目标高速运动和目标低速运动的问题。
本文采用基于三阶自相关变换对目标进行检测,这种算法对目标的平移、旋转和伸缩具有不变性的特点,特别适应于目标有水平位移、前后移动和旋转的各类情况。本文还对三阶自相关变换的快速算法进行了初步的研究。
组合神经网络在图像目标识别方面较单一神经网络有着更好的效果,但如何有效地进行组合将直接关系到网络的性能。本文提出并研究了用于图像识别的两种组合神经网络结构,其一是将一个网络整体分割成儿个子网络然后将子网络的输出进行合并;其二是将一个网络部分分割成儿个子网络然后将子网络的输出进行矢量相加。使用本文提出的两种组合神经网络结构进行图像识别,降低了网络的复杂度,提高了网络运算速度,改善了单个神经网络在复杂度较大情况下的收敛性。
应用本文提出的算法和理论,对含有运动车辆的高速公路视频图像采用基于高阶统计量的静态背景提取算法实现了静态背景的提取,利用提取出的静态背景采用三阶自相关变换实现了车辆检测,对车辆牌照进行基于单帧视频画面的目标定位和识别,都取得了满意的结果。