自适应模糊RBF神经网络的多智能体机器人强化学习

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:qipiaolang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多机器人环境中的学习,由于机器人所处的环境是连续状态,连续动作,而且包含多个机器人,因此学习空间巨大,直接应用Q学习算法难以获得满意的结果。文章研究中针对多智能体机器人系统的学习问题,提出自适应模糊RBF神经网络强化学习算法,网络本身具有模糊推理能力、较强的函数逼近能力以及泛化能力,因此,实现了人类专家知识与机器学习方法的结合,减少学习问题的复杂度;实现连续状态空间与动作空间的策略学习。
其他文献
7月2日晚,招商海德公园artdeco营销中心璀璨开启。当晚,数百名意向客户、招商地产的新老业主、准业主及特邀嘉宾到场助兴,共同见证了招商海德公园营销中心的炫耀启动。招商局地
对聚对苯二甲酸乙二酯的主要测试指标二甘醇、端羧基、特性粘度的分析方法进行了比较,并提出了具体改进意见及测试过程中的最佳方案。
在我国许多地区的婚嫁中,普遍流行着哭嫁习俗,而土家族地区的哭嫁艺术却历史悠久,独具一格,是土家姑娘出嫁时,通过'哭'和'唱'的方式来抒发内心情感,是婚娶过
铬的主要污染业是金属加工、电镀、制革等行业,距调查,遭受铬污染的土地面积其中轻度污染占46.7,中度污染占9.7[1]。因此,很有必要对CR(VI)在土壤中还原与吸附的影响因素进行
现今社会,信息化与我们工作生活的关系越来越密切,每时每刻,我们都依赖电脑电话电视为我们带来便利和欢乐。中国人是重亲情,以家庭为单位的群体,无论下班后或是久别.只要回到家就要
论文讨论了在ECT系统中利用二维断层图象进行三维表面重建的方法。首先对二维断层图象序列进行抽取轮廓、细线化、轮廓线追踪处理;然后对两相邻断层图象进行轮廓匹配;在两层已知(重建)图象轮廓中间插入若干个插值图象时采用同经度方向位置校准轮廓加权平均方法获得插值轮廓;最后在相邻的已知轮廓或插值轮廓采用最短对角线法进行三角片表面重建。仿真结果表明,利用上述方法可以较好地重建物体的三维表面。
自从邓小平同志对社会主义的本质作了高度概括,从而科学地回答了什么是社会主义之后,就不断地有人提出“解放和发展生产力”不是社会主义和资本主义的本质区别。作者认为:社
舞台工作是从把有魔力的"假使"引进剧本和角色的时候开始的。"假使"是一架起重机,它把演员从现实生活中转移到假使的规定情境中去,想象起了重要的作用。艺术就其本质来说,就
目前的社会信用信息工程中,许多的政府部门都建立了自己的信用信息数据库,但在政府各级部门数据库之间进行数据交流和共享存在着许多的问题,在许多地方,数据共享还是一片空白。We
论文提出了一种信息过滤方法,即在奇异值分解(SVD)的基础上,运用粗糙集(Rough Sets)理论进行信息过滤。通过对词语×文档矩阵进行奇异值分解得出近似矩阵,改变了一些词语在