论文部分内容阅读
生物视觉系统是人类已知的最为强大和完善的视觉系统,其结构特点和运行机制对计算机视觉模型有重要的启发意义。近几十年来,对生物视觉系统的研究取得了非常丰富的研究成果。基于现有计算机架构,可以从这些研究成果中总结出具有启发意义的生物机制,用于指导物体识别算法的设计与建构。本文从计算机视觉系统整体设计的角度,通过对基本生物机制的分析,探讨它们与计算机视觉模型之间的联系。根据对生物机制的分析,总结了计算机模型设计的指导性原则,认为在设计物体识别算法时,应考虑分层结构、感受野、底层特征学习、计算的局部性、结构的一致性、信号反馈以及注意力选择等方面的特性。利用这些指导性原则,对相关物体识别算法的优缺点进行了分析,并应用到实际的模型设计中:1.利用分层结构、底层特征学习、计算的局部性、结构的一致性以及信号反馈等生物启发的特性,提出一种多层在位学习网络。即利用统一的神经元模型构建多层神经网络,在同样的学习框架中整合无监督学习与监督学习,通过软性监督的方式将监督信息自上而下传递,避免了反向传播网络的局部极小问题和梯度消失问题。模型通过对环境与任务的学习与适应得到分层的特征表示和自下而上逐渐增强的特征不变性。软性监督信号有效地提高了神经元的类型纯度,有利于改善特征不变性并提升分类性能。分层的特征不变性可以在不同任务间共享,加快新任务的学习速度。2.在多层在位学习网络模拟多个皮层结构的基础上,对皮层内部功能层进行了建模,实验表明皮层内部无监督与有监督功能的分离是必要的。另外在皮层内部结构上模拟了自适应的侧向连接权重,网络通过自适应学习得到形如墨西哥帽的侧向连接权重,这种特性有助于自组织特征映射的形成以及建构更接近生物机制的物体识别算法。3.利用分层结构、感受野、底层特征学习、结构的一致性以及信号反馈等生物启发的特性,选择多层神经网络最优的底层特征设定方式。通过一个完整的物体识别任务,比较了不同的底层特征感受野设定方式。在实验中,生物启发的底层特征学习方式取得了最高的识别率,并且生成与简单细胞感受野非常相似的底层滤波器。从而验证了相关模型设计的指导性原则,即底层特征的感受野应当从训练样本中学习得来,从而具备对信息去相关并降低冗余的特性;在分类训练阶段,底层特征感受野应当进行自适应调整。实际的模型设计以及相关实验证明,生物启发可以用于改进物体识别算法。