分布式强化学习在RoboCup中的应用

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:soloviola
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注。基于主Agent的概念改进了传统的群体强化学习算法,应用于机器人足球(Robocup)仿真实验中,取得了初步结果。
其他文献
针对车轮踏面擦伤采集的数据到PC机的传输问题,设计一种基于USB总线技术的数据通信系统。该系统利用FPGA实现采集数据流的收发时序,通过USB2.0接口芯片CY7C68013与主机进行通信
期刊
周大生首批救援物资争分夺秒送至雅安4月21日下午,周大生珠宝第一批两卡车救援物资,包括食品、水及医疗用品,由周大生珠宝西南大区总经理康辅光亲自押车,送至雅安灾区,并由雅安市
12月8日上午,宝琳国金珠宝交易中心在深圳水贝盛大启幕。宝琳国金珠宝交易中心是宝琳集团携手国金国银集团强强联合,斥巨资打造的集珠宝交易中心、多功能珠宝展厅、超大体量珠
介绍了CC—Link现场总线技术在工业蒸汽锅炉的给水系统的成功实现。阐述了CC—Link现场总线结构特点及其通讯原理,并结合工业燃煤蒸汽锅炉给水系统的特点介绍系统中基于CC—Li
目的:研究桃仁-红花药对治疗股骨头坏死(ONFH)的作用机制。方法:采用网络药理学方法。以化合物口服利用度(OB)>30%和类药性(DL)>0.18为标准,通过中药系统药理学分析平台(TCMS
摘 要 目的:比較水蒸气蒸馏法(SD)与提取-共沸精馏耦合技术(WER)提取枳壳、香附总挥发油的效果,确定更优提取方法,以改善气滞胃痛颗粒剂中挥发性成分的提取工艺。方法:分别采用SD法与WER法提取枳壳、香附的总挥发油,对两种方法所提取挥发油的得率进行配对t检验;采用气相色谱-质谱联用技术(GC-MS)对两种方法所提取总挥发油进行分析,明确其主要成分,并采用面积归一化法测定并比较主要成分的相对含量
“今年以来,当国际国内黄金市场零售价格稳中回落之时,银川黄金市场的销售虽然没有出现一轮又一轮的消费热潮,但各类品牌钻饰,却在沉寂了多年之后正悄然复苏,成为众多银川市民心仪
语音特征参数MFCC(美尔频标倒谱系数)是语音识别中最有效的特征参数之一,但由于MFCC参数的计算量太大而限制了其在低端嵌入式平台的应用;针对台湾凌阳公司的16位语音型单片机SPCE061A采用优化的双字定点算法研究了MFCC参数的快速提取方法,使得计算一帧256点(32 ms)语音数据12阶的MFCC参数只需13.8 ms,比未改进的浮点算法速度快30倍,达到了实用的目的。
水灵球许许多多泡泡形成的大水球,在指尖充满绚丽色彩、灵光闪动,色彩炫耀的珍珠在泡泡中绽放着动人的光彩,