强化学习在RoboCup带球任务中的应用

来源 :微计算机信息 | 被引量 : 0次 | 上传用户：hongqinshuling

【摘要】

：

本文提出了一种基于强化学习的足球机器人带球任务的解决方案,带球方从阶段的开始到结束均尽力去控制足球,对方的队员则尽力从控球方抢夺足球。在本论文中控球方采用SARSA控

【作者】

：

刘飞陈焕文陈鹏慧蔡琼

【机构】

：

长沙理工大学,湖南信息职业技术学院

【出处】

：

微计算机信息

【发表日期】

：

2012年9期

【关键词】

：

强化学习带球控制算法 Reinforcement Learning Dribbling control algorithm

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出了一种基于强化学习的足球机器人带球任务的解决方案,带球方从阶段的开始到结束均尽力去控制足球,对方的队员则尽力从控球方抢夺足球。在本论文中控球方采用SARSA控制算法,防守方采用传统的策略。将这两种策略应用于4V3机器人比赛环境中,实验结果显示,经过多次的学习,在机器人的带球时间上取得了理想的效果。

其他文献

发挥“两课”作用践行“北京精神”

＂两课＂教学作为培育大学生世界观、人生观、价值观的主渠道和主阵地,其内容与北京精神的内涵高度一致;新形势下,＂两课＂教学应进一步结合高职学校特点,改进教学方式,把＂两课＂教学与

期刊

北京精神“两课”教学＂The Spirit of Beijing＂ the ＂Two Courses＂

基于面固化的快速微成型控制算法设计

针对基于面固化的快速成型技术应用于成型微小器件,设计了一整套的成型控制算法,包括CAD输出STL格式文件、VC环境下对其加载和显示算法,对STL模型的切片算法以及切片后截面轮廓的填充算法。分析了基于该控制算法,利用数字微反射镜器件(DMD)作为动态掩模板来实现面固化成型的制作方法的误差,并与传统的点固化成型法的制作误差进行了比较。结果表明,面固化成型法能够减小误差并提高成型速度,是一种有效的快速成

期刊

快速微成型面固化控制算法切片rapid micro-prototyping surface-curing control algorithm sl

基于S3C44B0X的砂石碱活性测定系统

设计了一种基于S3C44B0X处理器和μCLinux操作系统的砂石碱活性测定系统。介绍了该系统的工作原理及硬件电路和软件设计,阐述了一种PID参数自整定和智能控制算法以及光栅尺的辨向及细分电路的原理。系统中使用MiniGUI提供了友好的用户接口,使用光栅尺获得了更高的测量精度。

期刊

S3C44B0XΜCLINUXMINIGUIPID光栅尺砂石碱活性S3C44B0X μCLinux MiniGUI PID grating

坚强电网争创三优

济阳县供电公司隶属山东省电力集团总公司．为济南供电公司代管的国有中型(一)类企业。该公司是济阳县境内唯一合法从事供用电管理、服务的企业。担负着全县53万居民的供电、保

期刊

电网供电公司供用电管理电力集团运作模式电力安装电力供应济阳县山东省集团化企业

基于非线性模型的开关磁阻电机有限元分析

本文旨在运用有限元分析法研究开关磁阻电机磁场。开关磁阻电机具有双凸结构特性,所以其磁场呈非线性。Ansoft软件可得到不同转子位置下的磁化曲线族、电感及转矩特性曲线,再

期刊

非线性模型开关磁阻电机有限元法nonlinear model switched reluctance motor finite element met

如何提高初中物理教学的趣味性

为了培养学生对物理知识的学习兴趣,帮助学生更加全面、客观、深入地建构和理解物理概念和基本规律。本文立足于趣味教育理念,从学生的兴趣个性、生活经验和思维认知规律角度

期刊

初中物理趣味性教学科学探索

施用有机缓释肥对水稻产量和土壤地力的影响试验初报

为探索施用有机缓释水稻专用肥在水稻生产上的化肥减量增效作用,连续四年,进行了施用缓释肥对水稻产量和土壤地力变化的影响试验。结果表明,施用有机缓释肥作底肥的组合施肥

期刊

有机缓释肥化肥减量水稻产量地力

怀川文化与河洛文化的关系及其价值

黄河以北以焦作为主体的地区是河洛文化区内的一个重要区域,长期以来由于其特殊的环境、历史、行政以及区位,在河洛地区的东北部形成了独特的怀川文化。怀川文化的形成与河洛

期刊

怀川文化河洛文化关系价值Huaichuan CultureHeluo Culturerelationshipvalue

敬业务实创新向上——江西省袁州区供电有限责任公司

宜春市袁州区供电有限责任公司座落在美丽的秀江河畔．于1999年11月26日正式挂牌运作．是从事电力输、配、售的国有股份制企业。

期刊

袁州区公司责任有限供电江西省务实创新1999年股份制企业宜春市挂牌

刑法修正的利益失衡问题：表征、原因与对策

刑法修正是一种利益调整方式,应该实现利益平衡。但是,我国刑法修正存在着利益失衡问题,其主要原因是刑事立法理念没有根本转变,刑法修正过于趋从舆论与政策需求,对所要修改

期刊

刑法修正利益失衡利益平衡

强化学习在RoboCup带球任务中的应用

与本文相关的学术论文