论文部分内容阅读
视觉系统是人类感知系统的重要组成部分,它使得人类具有了视知觉能力,能够完美地实现对外界视觉信息的接收、处理、分析和理解。模拟视觉系统的信息处理机制,构建具有人类智能水平的机器智能是计算机视觉、模式识别和机器学习等领域的重点和难点课题。一种普遍的观点认为,在人类的进化过程中,视觉系统是在对外界视觉信息的不断适应过程中逐渐发展起来的,视觉系统的神经机理与自然图像等外界信号的统计特性密切相关。因此,探索自然图像的统计特性,对于构建符合视觉机制的计算模型具有重要帮助。本文以自然图像的统计特性为基础,从模拟人脑初级视皮层(V1区)细胞的神经机制出发,通过理论探索,构建计算模型,并将理论和模型应用到模式识别任务中加以验证。研究内容主要包括两大部分:第一部分以理论研究为主。以自然图像为研究对象,根据人脑Ⅴ1区神经细胞的“稀疏性”、“相关性”以及“超完备性”等生理特点,构造了与Ⅴ1区视觉机制相符合的图像编码模型。第二部分以提高应用能力为目标。通过模拟和实现初级视觉系统的信息处理过程,对理论模型进行验证,得到了具有一定实用价值的应用模型。本论文的主要创新点有:●提出了基于成对累计量的自然图像拓扑编码模型(PCICA)及其快速学习算法(PCICA-F)。由于传统的线性模型并不能够体现Ⅴ1区复杂的拓扑结构,本文根据Ⅴ1区神经细胞具有的稀疏性和相关性两大特点,从对神经细胞之间二元关系进行建模的角度出发,在独立分量分析模型(ICA)的基础上,将成对累计量与线性汇聚结合,得到能够模拟Ⅴ1区拓扑结构的PCICA模型。在模型的优化目标求解过程中,为了克服传统算法效率较低的缺点,在“不动点迭代”和“牛顿法”的基础上,推导出估计PCICA模型的PCICA-F算法,并且理论上证明了该算法具有三阶收敛的特点,比同类算法至多二阶收敛的性能有一定提高。●提出了基于准正交估计的自然图像超完备拓扑编码模型(OPCICA)及其快速学习算法(OPCICA-F)。PCIO模型受ICA模型限制,并不能够体现Ⅴ1区神经细胞的超完备特点。针对传统超完备方法在模型估计时计算量较大、算法效率较低等缺点,本文根据图像特征提取任务的特点,放宽了PCICA模型的部分约束,在准正交假设下提出了自然图像的超完备拓扑编码模型(OPCICA)。此外,在PCICA-F算法的基础上结合准正交迭代的处理方法,提出了估计OPCICA模型的OPCICA-F算法。该算法不仅继承了PCICA-F易于使用、收敛快速的优点,它还能够从自然图像中估计出同时满足V1区神经细胞“稀疏性”、“相关性”和“超完备性”的滤波器集合,更加符合生理特点。●提出了一个模拟Ⅴ1区复杂细胞信息处理机制的图像特征提取模型。该模型首先使用OPCICA-F(?)算法,从图像集中学习出类似于复杂细胞感受野的滤波器集合。然后利用这些滤波器组成的复杂细胞描述子,提取目标图像的局部不变特征,经过降维处理后,使用有监督的分类器进行识别。复杂细胞描述子具有类似于复杂细胞的不变特征提取特点,不仅克服了传统线性模型对图像的微小变化较为敏感等缺点,并且具有较好的识别能力。此外,与稀疏编码模型相比,复杂细胞描述子在特征提取时不需要反复迭代,其过程简单快速,效率较高。在Caltech-101数据库和MNIST数据库上验证了模型的有效性。