Q学习算法在RoboCup带球中的应用

来源 :系统仿真技术 | 被引量 : 0次 | 上传用户:goblinzehong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人世界杯足球锦标赛(RoboCup)是全球影响力最大的机器人足球比赛之一,而仿真组比赛是其重要的组成部分.鉴于带球技术在仿真组比赛中的重要性,我们将Q学习算法应用于带球技术训练中,使智能体本身具有学习和适应能力,能够自己从环境中获取知识.本文描述了应用Q学习算法在特定场景中进行1 vs.1带球技术训练的方法和实验过程,并将训练方法应用于实际球队的训练之中进行了验证.
其他文献
首先介绍了网络学习控制系统,并用MATLAB对以神经网络作为网络学习控制器的控制系统进行实例仿真.仿真结果表明网络诱导延时越大,系统控制性能越差.最后对仿真结果做了简单分
仿真是以相似性原理、控制理论、计算机技术、信息技术及其应用领域相关专业技术为基础,以计算机和各种相关物理设备为工具,对实际或假想系统进行试验研究的一种综合性技术,
期刊
【摘 要】速写训练在高校美术类课程中有着极其重要的地位,同时也是艺术教育的重要组成部分之一。在计算机制图和网络信息技术日益丰富的今天,作为一名高校美术类专业教师面临着新的挑战。本文主张速写训练始终贯穿在高校美术类课程教学中,必须立足于培养习惯,注重在绘画速写训练中培养写生意识。启发学生深入领悟美术学习过程的重要内容,引导了解创造作品与素材积累的关系。   【关键词】对象描绘 教学方法 引导 细化 
通过对当前大学物理实验教学中存在的问题的分析与研究,指出实验教学在培养学生探究性思维和科学能力中所担当的重要作用,提出用研究型教学理念指导工科物理实验教学的整体优化
针对环境学科人才培养的特点,结合时代对学生创新能力的要求,提出了环境学科创新实验的模式,介绍同济大学环境学院经过4年多研究、实践和完善,建立起来的环境科技创新实验具
基于专家系统和模糊综合评判理论,提出将由专家经验确定的故障现象重要程度权重系数融合到模糊关系矩阵中,提高模型预测结果的准确性,最后进行了实例分析.
多载波CDMA(MC-CDMA)是一种把正交频分复用(OFDM)和CDMA结合起来的新一代移动通信系统.本文详细构建了一个MC-CDMA系统的数学模型,并表达出了它的矩阵-向量表示法,在对此系统
在探讨本科生科研训练改革的内容和模式的基础上,构建了课内一课外教学体系,将科研项目引入化工专业实践教学环节中,克服了以往单纯使用教材的传统模式。通过工程实践与课程设计
【摘 要】基础教育课程改革对当今我们教师提出了新挑战、新要求。课程改革的关键在于教师,只有不断加强教师的职后教育,尤其是农村骨干教师的培训,才能造就高质量的教育水平。由此,笔者认为加强“领雁工程”农村骨干教师培训是非常有必要的,也是促进教育均衡发展的重大举措之一,但必须要注重培训实效。   【关键词】“领雁工程” 农村 骨干教师 培训     基础教育课程改革将给教师带来严峻的挑战和不可多得的机遇
结合高等学校基础课实验教学示范中心建设标准,阐述了编写基础物理实验教材的想法与做法。