性能势算法研究及在RoboCup中的应用

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：achun5808

【摘要】

：

强化学习是人工智能领域中解决学习控制的一种重要方法。在强化学习算法中，平均奖赏强化学习是以平均奖赏值作为参照标准，适用于解决具有循环特性或不具终结状态的问题，其存在参

【作者】

：

杨宛璐陈玮黄浩晖王广涛

【机构】

：

广东工业大学自动化学院

【出处】

：

计算机工程与设计

【发表日期】

：

2014年3期

【关键词】

：

足球机器人强化学习性能势 G-learning算法多智能体系统 RoboCupSoccer reinforcement learning performa

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

强化学习是人工智能领域中解决学习控制的一种重要方法。在强化学习算法中，平均奖赏强化学习是以平均奖赏值作为参照标准，适用于解决具有循环特性或不具终结状态的问题，其存在参数和环境的敏感及收敛速度慢等问题，并且强调的是单个智能体的独立学习。针对上述问题，考虑单个智能体与其它智能体的关系及影响，将一种改进的基于性能势强化学习算法——Glearning引入到多智能体系统中，设计出一种新的强化学习算法，将新设计的强化学习算法应用在RoboCup的Keepaway平台上。仿真结果表明了在选择较好参考状态的条件下有效提高

其他文献

基于光线投射算法的体积光实时绘制

为了模拟空气中粒子散射光线形成的自然光束效果,提出了基于光线投射算法的体积光实时绘制算法。以光源视角渲染场景并保存场景深度值,在正常视角下在始于屏幕止于模型上某点或远裁剪平面的向量上进行采样,将采样结果和场景的光照混合作为屏幕像素的最终颜色值。为获得最大效率,在GPU端对场景进行两边绘制以消除采样和场景复杂度的相关性,使其仅和屏幕分辨率有关,在提高算法性能的同时,最大可能地获得逼真的体积光效果。模

期刊

实时绘制光线投射采样场景深度颜色混合real-time renderingray-castingsamplingdepth valuecolor bl

浅谈水利施工中的混凝土裂缝控制

随着社会的快速发展,水利工程的建设也日益增多,为了保证水利工程项目的稳定性、安全性,必须保证混凝土不会出现裂缝现象.本文对水利施工过程中出现混凝土裂缝现象的危害进行

期刊

混凝土裂缝控制水利施工

真空联合堆载预压法在潮间带地区的应用

基于研究真空联合堆载预压法加固软基的机理，通过结合工程实例，重点研究了真空联合堆载预压的施工工艺及其在潮间带处理软土地基方面的有效性。结果表明此法在工艺上经济、可行

期刊

真空联合堆载预压潮间带施工工艺加固软基

威海市城镇化发展过程中农村劳动力转移问题探析

威海市通过吸收大量本地农村劳动力和外地劳动力,推动了城镇化建设的快速发展,已经形成了＂一群三轴一带＂的城镇网络。但在劳动力转移过程中还存在限制政策阻碍了农村劳动力的流

期刊

劳动力转移城镇化labor - transfer urbanization

高炉布料传动装置状态诊断方法研究

高炉布料装置结构复杂、人员无法接近，且由于特殊的环境因素，常用的振动诊断方法难以实施。笔者以布料系统驱动电机的定子电流作为信号分析的切入点，提取传动系统的特征频率。由

期刊

循环平稳MCSA特征提取故障诊断Cyclostationary MCSA Feature extraction Fault diagnosis

两轮自平衡小车可控角度的推导研究

通过对小车系统的受力分析，推导出小车自平衡条件，即电机水平驱动力需要大于小车重力水平分量。引入小车系统各硬件参数，计算出最大可控角度，并得到可控角度与路面摩擦系数间的关

期刊

两轮自平衡小车动态平衡等式可控角度The two-wheel self-balanced vehicle Dynamic balance equation

电厂热工调试自动化系统的可靠性探徼

电厂热工调试自动化系统是我国在自动化领域较早运用的系统，在发展过程中得到不断的改善。各种工业企业迅速发展，对于电力的依赖程度也愈来愈强，电力工业技术强弱对国民经济的发

期刊

热工调试自动化系统可靠性分析探讨

华莱士·斯蒂文斯与“最高虚构”

华莱士·斯蒂文斯（ＷａｌａｃｅＳｔｅｖｅｎｓ，１８７９－１９５５）是美国诗坛上一位大器晚成的诗人：他的第一本诗集《风琴集》（Ｈａｒｍｏｎｉｕｎ）于１９２３年诗人４４岁时方问世，５０岁后更是一直笔耕不辍。他拥有诗人和保险公司副总裁的双栖身份，推出了颇具

期刊

最高虚构斯蒂文诗歌想象华莱士象力现实世界社会现实宗教哲学思考现代意识

中国鲜苹果出口贸易成本测算与分解

内容提要：为了促进中国苹果出口贸易发展、提供新的微观解释视角，基于Anderson & van Wincoop （2003）贸易成本理论构建改进的贸易引力模型，对2004-2013年中国与20个主要贸易伙伴国苹果出口贸易成本进行测算与分解，发现中国苹果出口贸易开放度有了提升，贸易成本在2004-2013年期间呈现下降态势；人均GDP绝对差值与中国苹果出口贸易成本呈现反向变动，不存在“林德效应”；贸

期刊

鲜苹果出口贸易成本引力模型面板随机效应模型fresh apples trade cost of export Gravity Model Panel S

全国1+N职业培训项目葡萄酒发展中心葡萄酒培训师、侍酒师招生

促进社会就业满足葡萄酒行业及餐饮行业迫切需求全国1+N职业培训项目葡萄酒中心在国内首次侍酒师、葡萄酒培训师培训名师名家讲课以及理论学习与实践相结合的授课方式考核合

期刊

培训师劳动和社会保障部职业培训就业培训

性能势算法研究及在RoboCup中的应用

与本文相关的学术论文