论文部分内容阅读
认知机器人是像人类一样能够感知、动作并通过学习自主发育认知的高级智能体,近年来在人工智能领域受到了广泛的关注。具有认知发育能力能够使机器人自主应对复杂多变的环境,适应非特定、多任务场景,有助于机器人提高自主化水平并改善人机交互效果,促进机器人更好地为人类服务。认知发育模型需要能够实时学习、记忆新类物体并自主总结已有知识,进而发育出基于类别的物体概念。然而,目前认知机器人的认知发育模型存在模态单一、模态之间不通用、结构预定义、线下训练、无法自主发现和反馈错误表示及处理大规模连续数据流等问题。本文主要研究认知机器人在人类日常生活场景中对物体概念的认知发育问题,建立机器人与人类共同的知识基础,促进人机交互。受人类婴儿认知发育理论及大脑知识表示生理学研究的启发,本文建立了一系列基于增量式自组织神经网络的认知发育模型,使机器人通过在线、增量式学习,提升机器人的知识量,并利用网络的自组织聚类能力,形成基于类别的物体概念,提高机器人的认知水平。为提高机器人认知发育模型的学习效果,并解决已有认知模型存在的以上问题,本文针对机器人学习物体概念的认知发育模型展开了更加深入的研究,主要包括以下几个内容:1)基于增量式自组织神经网络的认知发育模型。通过了解人类婴儿认知发育的心理学理论和大脑物体概念表示的生理学理论,提出了将增量式自组织神经网络作为通用型认知发育模型的主框架,用于发育多模态知识。该模型通过网络级联不仅能够模拟大脑中不同模态之间的相互关联,还能够实现从具体的样本表示到抽象的符号表示的知识发育。2)基于视听融合的分层式自主认知发育模型。针对现有认知模型存在模态单一、模态之间不通用以及模型预定义的问题和第二章中传统的增量式自组织神经网络的固定相似度阈值方法存在的问题,本文提出了一种基于视听融合的分层式自主认知发育模型(SOHCA-AVF),使机器人在线地学习物体的视听觉信息并实现视听融合。该模型包括视、听觉两条通路,每条通路有三层增量式自组织神经网络:样本层以无监督的方式增量地学习和自组织物体的视觉特征和名字,包含了一种动态自适应相似度阈值策略,能够让网络节点根据数据自主聚类而不用人类预定义阈值;符号层是高低层网络之间信息传递的桥梁,不仅能从样本层中提取的聚类结果编码成简洁的符号表示传递到关联层,还能将关联层的信号解码传递到样本层;关联层绑定同时被激活的视听符号,建立两种模态间的关联关系,包含了一种自上向下的应答策略,能够让机器人自主回调关联模态、解决冲突关联和调节已学到的知识。基于两个数据集和实际任务的实验结果表明,该模型能有效地在线学习和关联物体的视觉特征和名字,且能够利用自己的经验自主提高认知水平而不用询问人类。3)融合交互式强化学习的自组织认知发育模型。针对第三章的模型利用被动感知来获取知识的认知方法有时会不可避免地产生错误的表示,且无法自主反馈并在线纠正错误的问题,本文提出了一种融合交互式强化学习的自组织认知发育模型(SODCA-IRL)对其进行改进。该模型将第三章中的分层式认知发育模型规范化到交互式强化学习框架中,能够以平行交错的方式在线学习物体概念并通过与人类交互来检验学习效果。为了实现两种算法的结合,该模型为个别神经网络节点配备了一种新颖的指数型记忆模型,通过两个遗忘因子控制,来模拟人类记忆的巩固和遗忘过程。此外,本文提出了一种交互式强化策略来提供奖励或惩罚并执行纠错。这些反馈作用于记忆模型的遗忘因子,从而强化或削弱节点的记忆强度,实现巩固正确知识,纠正并遗忘错误的表示。实验结果表明,该方法能够有效利用人类反馈,显著提高学习效果,减少模型冗余。4)具有终身学习能力的自组织-反思认识发育模型。针对第三章和第四章的认知方法在终身学习中学习连续数据流时会产生巨大的存储和计算消耗的问题以及增量式自组织神经网络的相似度阈值调节会受到数据输入序列的影响,本文提出了一种自组织-反思认知发育模型(SORCN),融合了增量式自组织神经网络(SOINN)和一种改进的快速搜索和寻找密度峰值聚类算法(CFS),能增量式地学习和定期反思所学的知识,从而实现机器人的终身认知发育。改进的CFS聚类算法用于反思过程,包括聚类、融合、分割三个步骤:聚类步骤采用了一种自主中心选择策略使CFS能够适应SOINN的在线学习方式;融合步骤包括一种基于类内拓扑构建的策略,能够实现CFS的增量式聚类并促进SOINN的相似度阈值调节,这也有利于提高节点的泛化能力,从而降低网络的存储消耗;分割步骤采用基于类内中心重选的策略,用于调整聚类结果。该模型还包括一种基于反思结果的SOINN竞争学习方法,能够根据聚类中心快速找到输入的匹配节点,而无需遍历整个网络,从而大大降低处理大规模数据时的计算消耗。实验结果表明,SORCN能够有效地降低计算和存储消耗,促进网络发育,实现终生学习。