基于最先策略增强学习的ART2神经网络

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:freeman_1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于最先策略增强学习的 ART2神经网络 FPRL-ART2(Foremost-Policy Reinforcement Learn-ing based ART2 neuraI network),并介绍其学习算法.为了达到在线学习的目的.在 FPRL-ART2中,从状态到行为值之间的映射中,选择第一个得到奖励的行为,而不是选择诸如1-step Q-Learning 中具有最优行为值的行为.ART2神经网络用于存储分类模式,其权重通过增强学习增强或减弱,达到学习的目的.并将 FPRL-ART2运用到移动机器人避碰撞问题的研究中.仿真实验表明,引入 FPRL-ART2后减少移动机器人与障碍物发生碰撞的次数,具有良好的避碰效果. This paper proposes a Foremost-Policy Reinforcement Learn-ing based ART2 neuraI network based on the first strategy to enhance learning, and introduces its learning algorithm.In order to achieve the purpose of online learning, in FPRL-ART2, Instead of choosing behaviors that have the best behavior values ​​in 1-step Q-Learning, such as the state-to-behavior mapping, and the AR2 neural network is used to store the classification patterns whose weights are passed Enhance learning to enhance or weaken, and achieve the purpose of learning.Furthermore, FPRL-ART2 is applied to the problem of collision avoidance of mobile robots.The simulation results show that the introduction of FPRL-ART2 reduces the number of collisions between moving robots and obstacles, Collision avoidance effect.
其他文献
一、多媒体英语教学的优越性多媒体在英语教学中的运用为教学注入了新的生机和活力多媒体具有图、文、声、茂合一的特点,使课堂教学变得更加形象直观,可对学生进行视、听等多
期刊
随着时代的发展,信息技术在生活中的应用越来越广泛。因此,高中信息技术课堂也必须与时俱进,注重培养学生的信息技术基础素养,让学生初步掌握以信息技术为工具促进其他学科学
期刊
如何提高初中体育课堂效率,让学生对体育课产生浓厚的兴趣,最大限度地开发他们的潜能,让学生在上好体育课的前提下,锻炼好自己的身体,成为新世纪国家建设的栋梁,这是我们体育
期刊
课堂教学是学生获取知识和培养能力的主要方式。因此,提高课堂教学效率是我们每个教师都应该认真思考的问题。结合实际教学,从激发学生的学习兴趣、增强学生的求知欲望、优化
本文就白血病休克发生的病理生理学基础,临床特征,以及白血病休克的防治等三个问题进行简要的讨论。一、白血病休克的病理生理基础1.白血病的基本病理改变与休克:白血病细胞
以心绞痛、急性心肌梗塞为主要临床表现的心脏转移瘤少见,笔者于1982年收治1例,经尸检经实。30岁男患,以典型心绞痛发病,以急性心肌梗塞为主要表现,但尸检证实并不存在心肌
为了应对加入WTO后的激烈竞争,提高煤炭产业综合发展能力,必须加快培育大型国有煤炭企业集团。这是从目前煤炭工业发展存在的主要问题和面临的严峻形势出发,在综合分析的基础
提高棚养蛋鸭产量是受多种因素影响的一项系统工程,棚址的构建、品种优选、饲料配制、过程管理等都是不可缺少的.依据蛋鸭生长过程及其规律来优化资源和注重过程管理,能够缩
《普通高中英语课程标准(实验稿)》指出:“高中英语课程应强调在进一步发展学生综合语言运用能力的基础上,着重提高学生用英语获得信息、处理信息、分析问题和解决问题的能力
期刊
研究表明冠脉内注入乙酰胆碱可引起无粥样硬化的动脉舒张而使粥样硬化的动脉收缩,向梗塞区供血的狭窄冠脉(IRSA)和向非梗塞区供血的狭窄冠脉(NIRSA)的反应,直到目前尚无定量