论文部分内容阅读
在大脑接收的来自外部世界的感知信息中,80%以上是通过视觉系统进行加工处理的。最近二十多年来,视觉信息加工的机制是心理学、神经科学、计算机科学等学科研究的重大课题之一。人们广泛认为,生物视觉系统在长期进化和发展中,自适应于自然环境中输入刺激的统计特性,但是生物视觉系统是怎样对外界环境的刺激模式做出响应?Attneave,Barlow和Olshausen & Field等从信息论出发,发展了稀疏编码理论,认为在视觉系统V1区神经细胞的处理过程中,一个重要的约束就是编码的稀疏性,从而利用较少的资源尽可能有效地编码更多的信息。稀疏编码理论在视神经细胞的响应特性和外部环境刺激的统计特性之间建立一种科学的数量联系,逐渐成为了一种有效理解人类神经系统信息加工机制的理论工具,是国际神经计算,神经网络和人工智能方面的一个研究热点。本论文以稀疏编码模型和理论为基础,从模拟大脑信息处理方式出发,在理论上进行创新性的探索,并将模型和理论成功地应用于计算机视觉的图像检索领域中。取得的主要成果包括:第一,面向知觉任务的稀疏编码模型最近的心理学和生理学研究成果表明,简单细胞的信息处理过程并不仅仅是一个数据驱动的过程,它还受知觉任务的影响,本文在Olshausen和Field提出的数据驱动的稀疏编码模型基础上,设计了面向知觉任务的稀疏编码模型(简称TOSC),TOSC模型探索了什么信息应该被编码的问题,也就是What-问题。在从输入空间到系数空间的编码过程中,为了提高编码系数空间的可分性,我们引入了模式分类任务的监督信息-判别距离,结合稀疏编码的约束条件形成新的代价函数(Cost function),然后,优化学习得到面向模式分类任务的稀疏编码模型;通过二分类任务(自然风景和建筑物的分类)的实验,我们验证了面向知觉任务稀疏编码模型的有效性。第二,双层反馈稀疏编码模型最近的研究成果表明,初级视皮层的加工过程远非简单的局部特征抽取,相反,它的加工是动态的、交互的和可塑的,它的加工过程受高级皮层的视觉推理和任务以及行为经验的影响。本文扩展了单层的基于ICA算法的稀疏编码模型,在多层感知机的基础上,我们提出了一个带反馈机制的双层稀疏编码模型(简称TLF-SC),在TLF-SC模型中,神经细胞的响应除了受稀疏编码准则的影响,即保持神经细胞响应的统计独立性,同时它还受到反馈信号的调节,使得神经细胞的编码能更加适应于高层的知觉任务。我们的仿真结果表明,TLF-SC模型的ICL神经元既表现出类似V1区简单细胞感受野的特性,也表现出对知觉任务的自适应性,同时TLF-SC模型还能取得比较好的分类性能。第三,基于注意机制的稀疏编码模型我们研究发现对作用于同一个输入刺激的简单