论文部分内容阅读
移动机器人是一种能够在工作环境中通过传感器感知环境和自身状态实现自主运动并完成预定任务的智能系统。移动机器人技术在工业、农业、航天、军事以及日常生活等领域有广泛的应用前景。自主导航技术是移动机器人研究的核心问题,如何提高移动机器人的自主导航能力和对环境的适应性是实现移动机器人在未知环境中能够可靠而灵活移动的关键问题。这就要求移动机器人在未知环境中具有认知能力,即机器人能从环境中自动获取知识、积累经验、不断更新和扩充知识,改善系统性能,其行为能在有目的的运动过程中逐渐智能化。研究具有认知能力的自主导航系统已经成为机器入学研究的重要方向,涉及认知科学、动物行为学、神经生理学、心理学和机器入学等领域。 本文基于生物学的认知机理,从仿生学的角度出发,着重研究了具有认知能力的移动机器人自主导航系统,包括对环境的认知与行为的自学习,深入分析了认知与行为学习对于移动机器人智能程度提高的重要性。本论文的主要研究工作如下: (1)基于动态可生长神经网络的拓扑环境建模 针对环境建模问题,利用自组织神经网络类似生物神经系统中的有序特征图以及其具有“感受-反应”的映射结构,本文设计了一种增长阈值可自主调节的动态生长型自组织神经网络(Growth Threshold Dynamic Growing Self-organizingMap,GTDGSOM)。该网络通过引入扩展因子(Spread Factor,SF),使网络增长阈值能随着环境自适应地改变,并利用SF控制网络生长,缩短了对移动机器人运动环境建模的时间。在环境建模基础上结合A*算法机器人能够找到一条从起点到终点的全局最优路径。为了删除路径上的冗余点以提高机器人行动的反应能力,本文给出一种紧缩算法(Constrictive Algorithm,CA)用于最优路径的进一步优化,使得优化后的最优路径的距离更短,最后实现了移动机器人在感知地图基础上的全局路径规划。通过在三种典型环境下的仿真实验,验证了该方法的有效性。 (2)操作学习自动机的设计及其在路径规划中的应用 基于Skinner操作条件反射的原理,结合学习自动机(Learning Automata,LA)的理论,本文提出了一种操作学习自动机(Operant Conditioning LearningAutomata,OCLA)。为反应生物学的认知机理,设计了取向单元和认知学习单元,分别用来模拟生物的取向性与渐进学习性。在移动机器人自主导航中,认知学习单元用来执行操作行为学习功能,以逼近机器人系统的执行部分;取向单元用来执行操作行为的评价功能,结合评价机制产生的取向性信息对操作行为网络权值进行调整。鉴于OCLA在学习过程中随机性较大、学习过程较长,本文提出了一种由专家知识引导的OCLA系统。仿真结果表明,该系统可使移动机器人自主学会选择符合生物取向性的行为,收敛速度较快,具有较高的适应性与鲁棒性。 (3)基于混合协调学习的反应式导航方法 鉴于未知环境下专家知识难以获取,同时原始强化信号可能因含有噪声或延时而导致系统的不稳定,本文利用模糊控制与行为评价学习机制,设计了一种混合协调学习机制,建立了操作行为学习(Operant Behavior Learning,OBL)模型。该模型中的动作评价网络由多层前向神经网络来构成,采用TD(λ)算法和梯度下降法进行权值更新;动作选择网络由操作行为规则集合构成,在不依赖于外界的专家领域知识的情况下仍能习得较优的行为。仿真结果表明,基于混合协调学习的反应式导航方法能使移动机器人通过与环境交互学习到避障行为与目标制导行为,提高了其行为学习能力。但是,由于OBL采用有限的操作行为个数,其应用受到了限制。根据遗传算法具有全局搜索的特点本文提出一种基于进化OBL(Evolution Operant Behavior Learning,EOBL)的反应式导航算法,实现了机器人导航行为学习的全局最优逼近,并且引入行为并行优化的思想以加快进化的速率,通过仿真实验验证了该算法的行为学习能力以及自主进化能力。 (4)基于分层学习结构的复合导航认知系统 结合全局与局部的环境感知信息,本文提出了一种基于分层学习结构的复合导航认知系统。该结构分为语言层、概念层以及子概念层,在语言层中应用GTDGSOM方法建立环境拓扑地图,在概念层利用反演控制的方法完成初始最优路径跟踪的行为,在子概念层中采用基于EOBL的移动机器人反应式导航方法,从而实现了避障行为及局部路径重规划行为。复合导航认知系统首先采用GTDGSOM建立感知地图,结合A*算法通过CA优化出一条初始全局最优路径,然后机器人跟踪这条路径向目标点方向运动,在运动过程中当传感器探测到当前环境与已知环境存在差异时启动局部路径规划层对路径进行重新规划。机器人认知实验表明该系统实现了跟踪全局最优路径行为、避障行为与目标制导行为的优化,使机器人渐进地获得认知与学习能力,能够满足导航系统实时性的要求。 本文的研究工作得到了国家自然科学基金项目(60774077、61075110)、国家“863计划”资助项目(2007AA04Z226)和北京市自然科学基金项目(4102011)的支持。本文的工作对于基于生物机理的认知模型与认知系统在移动机器人自主导航中的应用研究具有积极的意义,可以广泛应用于人工智能、机器人学、认知科学、神经生理学等诸多领域。