基于主智能体的群体学习算法GLBMA

来源 :江苏大学学报(自然科学版) | 被引量 : 0次 | 上传用户：NF_Frankie

【摘要】

：

以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学

【作者】

：

程显毅李淑琴夏德深

【机构】

：

南京理工大学计算机系,南京理工大学计算机系

【出处】

：

江苏大学学报(自然科学版)

【发表日期】

：

2005年5期

【关键词】

：

智能体主智能体强化学习 ROBOCUP 行为学习状态空间 agent main agent reinforcement learning RoboCu

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法.RoboCup仿真比赛试验表明,传统群体强化学习算法中的行为学习状态空间过大,连续状态空间的行为选择及多智能体合作求解等问题得到了解决.

其他文献

基于响应复杂度分析的振动控制算法

采用改进后的Lempel—Ziv的复杂度算法，对构建的结构位移响应符号序列进行复杂度分析．分析结果表明，所构建的振动系统响应符号序列复杂度可以很好地反映结构的固有振动特性，该算

期刊

响应序列复杂度算法振动控制振动特性response sequence complexity measure vibration control vibr

智能材料结构在汽车悬架系统减振中的应用研究

期刊

智能材料结构汽车悬架系统智能减振器

负顾客可服务的Geom／Geom／1离散时间排队模型

研究了一个单服务台的离散时间排队模型，正负顾客的到达服从几何分布，并且可以同时到达，正负顾客处于同等的位置．给出了两种抵消规则：抵消队尾的顾客，无论此顾客是否正在接受服务；抵

期刊

离散时间排队负顾客RCE—inimmuneSERVICINGRCE—immuneSERVICING抵消规则discrete-time queue

高频地波超视距雷达的极化滤波技术研究

在极化域内分析了按输出干扰最小为原则的极化滤波算法固有的抗干扰能力 ,指出了其抗干扰能力的有限性。对高频地波超视距雷达抑制天波电台干扰问题进行了研究。提出了单通道

期刊

超视距雷达极化滤波器抗干扰高频地波OTH radar Polarization filter Interferenc

近程雷达目标多分量信号处理研究

以目标多点散射模型为背景，提出了ＦＭ近程雷达回波混频后多分量信号模型。证明单频信号瞬时频率定义不适合多分量信号。首次提出利用ＴＬＳ－拓广ＥＳＰＲＩＴ结合数理统计方法求解多分量信号平均频率

期刊

近程雷达信号处理数字模型计算机模拟Short range radar Signal processing Mathe

小样本场合下相容性检验方法

针对武器系统试验次数少,试验之前有许多信息可利用等特点,研究了小样本场合下验前信息可信性检验方法,从统计观点看,就是验前验后样本是否相容的检验方法.主要介绍小样本场

期刊

相容性检验武器试验场小样本场合武器系统CompatibilityInspectionTest fieldNormal distribution

南京市不同人群对骨质疏松症知晓情况调查

目的了解南京市一般人群、医护人员和骨质疏松症患者对骨质疏松症相关知识的知晓情况及其影响因素,为制定合理有效的骨质疏松症健康教育策略提供参考依据。方法采用自行设计

期刊

骨质疏松症知晓不同人群

多传感器远距离目标跟踪

本文深入研究了二维平面上多传感器的位置对目标跟踪精度的影响。在理论上推导出：用多传感器同时对同一目标进行跟踪时，其跟踪精度主要受传感器和目标所成夹角及目标到各传感器

期刊

多传感器目标跟踪数据合成精度分析数据融合Multisensor Target tracking Data fusion.

路由器市场重现生机

由于路由交换机的出现,让一些业内人士一度预言一“路由器尤其是中低端路由器将被路由交换机所取代。”结果这种预言落空了。刚刚过去的2003年,路由器市场咸鱼翻身,其规模达

期刊

传统路由器路由交换机宽带接入市场三层交换机接入路由器低端用户大发展分支机构以太网

黑河市严厉打击盗采煤炭资源行为

11月下旬以来，黑河市政府组织市国土资源局、公安局、煤炭局等部门，采取突击检查、重点打击、集中清理的方法，对爱辉区金水一木耳气煤田进行了全面清查。

期刊

煤炭资源黑河市国土资源局政府组织公安局爱辉区部门清查

基于主智能体的群体学习算法GLBMA

与本文相关的学术论文