性能势算法研究及在RoboCup中的应用

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:achun5808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是人工智能领域中解决学习控制的一种重要方法。在强化学习算法中,平均奖赏强化学习是以平均奖赏值作为参照标准,适用于解决具有循环特性或不具终结状态的问题,其存在参数和环境的敏感及收敛速度慢等问题,并且强调的是单个智能体的独立学习。针对上述问题,考虑单个智能体与其它智能体的关系及影响,将一种改进的基于性能势强化学习算法——Glearning引入到多智能体系统中,设计出一种新的强化学习算法,将新设计的强化学习算法应用在RoboCup的Keepaway平台上。仿真结果表明了在选择较好参考状态的条件下有效提高
其他文献
为了模拟空气中粒子散射光线形成的自然光束效果,提出了基于光线投射算法的体积光实时绘制算法。以光源视角渲染场景并保存场景深度值,在正常视角下在始于屏幕止于模型上某点或远裁剪平面的向量上进行采样,将采样结果和场景的光照混合作为屏幕像素的最终颜色值。为获得最大效率,在GPU端对场景进行两边绘制以消除采样和场景复杂度的相关性,使其仅和屏幕分辨率有关,在提高算法性能的同时,最大可能地获得逼真的体积光效果。模
随着社会的快速发展,水利工程的建设也日益增多,为了保证水利工程项目的稳定性、安全性,必须保证混凝土不会出现裂缝现象.本文对水利施工过程中出现混凝土裂缝现象的危害进行
基于研究真空联合堆载预压法加固软基的机理,通过结合工程实例,重点研究了真空联合堆载预压的施工工艺及其在潮间带处理软土地基方面的有效性。结果表明此法在工艺上经济、可行
威海市通过吸收大量本地农村劳动力和外地劳动力,推动了城镇化建设的快速发展,已经形成了"一群三轴一带"的城镇网络。但在劳动力转移过程中还存在限制政策阻碍了农村劳动力的流
高炉布料装置结构复杂、人员无法接近,且由于特殊的环境因素,常用的振动诊断方法难以实施。笔者以布料系统驱动电机的定子电流作为信号分析的切入点,提取传动系统的特征频率。由
通过对小车系统的受力分析,推导出小车自平衡条件,即电机水平驱动力需要大于小车重力水平分量。引入小车系统各硬件参数,计算出最大可控角度,并得到可控角度与路面摩擦系数间的关
电厂热工调试自动化系统是我国在自动化领域较早运用的系统,在发展过程中得到不断的改善。各种工业企业迅速发展,对于电力的依赖程度也愈来愈强,电力工业技术强弱对国民经济的发
华莱士·斯蒂文斯(WalaceStevens,1879-1955)是美国诗坛上一位大器晚成的诗人:他的第一本诗集《风琴集》(Harmoniun)于1923年诗人44岁时方问世,50岁后更是一直笔耕不辍。他拥有诗人和保险公司副总裁的双栖身份,推出了颇具
内容提要:为了促进中国苹果出口贸易发展、提供新的微观解释视角,基于Anderson & van Wincoop (2003)贸易成本理论构建改进的贸易引力模型,对2004-2013年中国与20个主要贸易伙伴国苹果出口贸易成本进行测算与分解,发现中国苹果出口贸易开放度有了提升,贸易成本在2004-2013年期间呈现下降态势;人均GDP绝对差值与中国苹果出口贸易成本呈现反向变动,不存在“林德效应”;贸
促进社会就业满足葡萄酒行业及餐饮行业迫切需求全国1+N职业培训项目葡萄酒中心在国内首次侍酒师、葡萄酒培训师培训名师名家讲课以及理论学习与实践相结合的授课方式考核合