机器人足球中3打2战术的强化学习

来源 :合肥工业大学学报：自然科学版 | 被引量 : 0次 | 上传用户：dk0623

【摘要】

：

通过对机器人足球中的agent进行强化学习,研究连续性决策问题;介绍了机器人足球竞赛策略的一个子问题3打2战术.然后在这个分布的、实时、局部可观察的、有噪音的领域内,提出

【作者】

：

方宝富王浩

【出处】

：

合肥工业大学学报：自然科学版

【发表日期】

：

2002年z1期

【关键词】

：

3打2战术强化学习逼近函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过对机器人足球中的agent进行强化学习,研究连续性决策问题;介绍了机器人足球竞赛策略的一个子问题3打2战术.然后在这个分布的、实时、局部可观察的、有噪音的领域内,提出一种能够强化学习的思维来进行策略评价和动作选择的方法.实验结果证明,该文提出的自学习的策略明显优于Hand-Coded策略.

其他文献

深圳出台建筑节能扶持计划

为充分发挥财政资金的激励作用,积极推进全市建筑节能与绿色建筑工作,深圳市住房城乡建设局决定实施深圳市建筑节能发展资金2017年扶持计划,新的一年将重点扶持装配式建筑发

期刊

建筑节能深圳市财政资金绿色建筑发展资金建筑发展建设局装配式

族群身份的异域断裂与自反延续——以缅甸在昆商人为例

受缅甸国内族群身份政治性分类的影响,在中国昆明市拥有缅族、罗兴伽人、华裔以及掸族等不同族群身份的缅甸商人群体,无论是在商业经营、宗教生活,还是政治认同等方面都具有

期刊

族群身份缅甸商人社会网络自反性

环模颗粒饲料机的正确使用

环模颗粒饲料机在水产饲料的生产中扮演着非常重要的角色,笔者经过多年的教学和工作实践,对其正确的使用方法进行了总结,现介绍如下,供用户参考。一、合理调整环模与压辊之间

期刊

环模颗粒饲料机使用工作间隙物料清理装配更换检查

A3钢在不同CO2盐溶液中的腐蚀规律研究

通过静态、动态及电化学实验方法测试不同含盐量溶液中饱和二氧化碳对A3钢的腐蚀影响，以及溶液中Ca^2＋和S^2-对A3钢的腐蚀影响。研究结果表明，NaC质量分数50g／L时，腐蚀速率最大；温

期刊

油气井腐蚀腐蚀评价试片Oil and gas well CO2 corrosion Corrosion evaluation Specimen

高层房屋建筑工程技术管理的要点探析

二十一世纪下经济全球化的进程在不断发展,中国在这种环境中得到了发展的机遇。近年来经济水平的提高,为城市化的建设提供了物质基础,人们对于建筑的要求越来越高,房屋建筑行

期刊

高层房屋技术管理解决方案

深基坑开挖对紧邻建筑物的影响

为了深入分析深基坑开挖过程对相邻建筑的影响，依托实际工程，通过长期监测与分析，对其开展了深入研究，结果表明：合理的支护条件，能够减小对相邻建筑的影响，基坑开挖初期，建筑的沉降变

期刊

基坑紧邻建筑变形观泖

泥蚶、河豚与南美白对虾混养技术

由于至今未找到有效解决对虾暴发性病毒病的方法,虾池的潜力得不到充分发挥,为此,近年来我们在虾池的综合利用方面进行大量研究,先后进行了蚶虾、虾蛤、虾蟹、鱼虾等多品种、

期刊

苗种放养养成管理泥蚶河豚南美白对虾混养

二甲醚-内燃机代用燃料

全球发展面临着环境和能源两大挑战。因此，开发一种新型可再生能源显得尤为重要。DME有良好的着火性能，且十六烷值较高，人们尝试将一定比例的DME加入到甲醇或乙醇中作为助燃剂。

期刊

DME柴油环保

民族村寨文化振兴的三维视角:时间·空间·价值

民族村寨文化振兴是一个集多维度、多要素、多功能的系统性工程,是民族村寨文化历史延续、文化互动发展与文化功能提升的有机统一。具体而言,既包括时间维度的选择性扬弃,做

期刊

民族村寨文化振兴文化功能空间互动ethnic villagescultural revitalizationcultural functionsp

古云集油田超前注水技术研究及应用

超前注水有利于提高单井产量和油藏最终采收率，本文通过渗流规律、数值模拟和矿场数理统计研究，对超前注水提高低渗透油田的开发效果进行机理分析，提出超前注水期合理地层压力保

期刊

超前注水机理分析技术政策古云集油田waterflooding in advances analysis of the theory technolog

机器人足球中3打2战术的强化学习

与本文相关的学术论文