论文部分内容阅读
视觉感知一直是科学研究中吸引人们已久的问题之一。如何设计、制造能够像人类视觉系统一样高速而又有效的方式处理视觉信号的系统,一直以来是人类追求的梦想。虽然随着科学技术发展,计算机的计算能力飞速上升,图像高精度高速采集硬件普及,视觉算法不断提出和改进,和越来越多的神经生物实验数据,要设计出一个完善的系统能够处理哪怕人类视觉的初级任务,例如人脸检测,识别等等,都是一项极为挑战的问题。通过生物视觉来研究经过长期进化过的生物视觉系统有效工作的特征和机理,结合计算机视觉学习和模拟这些特征和机理来处理这些任务,被认为是解决该问题的有效途径之一。本文系统介绍了人类视觉系统,尤其是人类视觉初级系统,以及它们的功能结构和特征。同时,本文也简要介绍了现在流行的建模工具,包括概率模型和线性生成框架。本文还介绍了主成份分析,独立成分分析和稀疏编码,及如何使用这些算法对人类视觉初级系统建模,可以表现出其具有的稀疏性(sparse),超完备(overcomplete),拓扑(topography)等特征。本文的研究内容和主要贡献有:1.对稀疏先验的评价。稀疏属性被认为是人脑细胞能够高速有效的工作特征之一。然而,如何定义信号稀疏还一直是争论的问题。为什么有些分布被认为是稀疏的,而有些分布则不是,这些判断仍然具有一定的主观因素。本文通过对经典的稀疏编码模型,推导出有些稀疏先验能够通过使某个神经元本该自己表征的响应分配给其他神经元来减少目标函数值。这种现象不符合稀疏性质。我们定义该值为”复制奖励”并得到稀疏函数次加性的性质。我们使用该性质对不同的概率密度函数进行检验,并通过实验来验证。2.使用相似函数学习拓扑结构。引入了使用一层的网络结构学习出具有拓扑特征的V1的简单细胞感受野。由于使用传统的稀疏编码,即使没有使用拓扑的先验,得到的简单细胞的特征本身就包含了一定的拓扑信息。因此,相对于以前使用了两层网络和加入了拓扑先验的模型,使用改进之后的单层模型也能够学习出具有超完备的拓扑特征。3.基于非负稀疏编码的拓扑。非负矩阵分解由于比较好的符合生物实验中,神经元响应不可能是负数,并且针对现有的训练集合,能够得到部分加性组合等等较好的特性,因此成为了研究的热点。本文在基于已有的非负稀疏编码的基础上,加入了拓扑先验。同时,根据非负矩阵分解的乘性迭代公式的推导,推导出对于拓扑先验的乘性迭代公式。使用乘性迭代公式,算法的效率会更高,同时实验结果表明,该模型同样能够得到超完备,抗噪声的拓扑的结构,更好的解释的生物现象。