基于径向基函数网络的强化学习在多智能体环境中的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:laoxu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以机器人足球这种形式,将以上两者有机地结合起来,探讨了其可行性和有效性.该文的主要工作包括: (1)智能体结构与机器人足球的结合;该文探讨了智能体思想在足球机器人中的应用,并将智能体的模块设计和层次设计两者结合起来,对智能体的程序框架进行了研究. (2)学习任务的分解和任务的分配;该文总结了复杂环境中的减少复杂性的若干方法,并针对具体学习任务将其进行分解,在智能体中分配其任务. (3)强化学习在智能体中的应用;该文针对具体任务,研究了如何将强化学习实际运用于单个智能体的情况,提出了有效的目标函数.该文详细地对实验情况进行分析,并逐步地提出改进方案.对于多智能体的强化学习问题,该文设置了相应的学习和训练任务,结合实际情况应用了强化学习,并设计了新颖的强化函数. (4)径向基函数网络的应用;在该文中,径向基函数网络被应用在单智能体和多智能体足球机器人的训练环境中,取得了良好的效果.
其他文献
小学语文的教学内容中,识字是最为重要的内容。我们所学习的汉字,最初的识别记忆都是在小学完成的。因此,作为语文甚至是一切学科学习的基础,汉字的识别对于每个学生都显得十分重
随着经济全球化不断推进与时代不断发展的今天,综合国力的竞争已经逐步转变成人才的竞争,全面推行现代化教育、培养高素质人才被看成是我国重要的既定政策之一。汉语言文学作为
在围手术期间,常会发生因人体核心温度下降而引起的低体温并发症,直接影响着手术的成败和治疗的效果,而且其发生率比较高。针对这一普遍问题,医疗中通常使用水循环、加热毯、
意义世界是人类所特有的世界,人类文化的各个方面,都是人类追求意义、创造意义、拓展意义世界的努力.在日益注重感性需求的当代社会,为使设计的沟通性增强,使产品直接近于人,
质量、成本和制造周期是现代制造业中共同关心的三要点.并行工程要求在产品的设计阶段就考虑从产品概念形成到报废处理的整个生命周期.公差设计是产品设计中的重要组成部分.
该文选择了淬硬性能较好的轴承钢GCr15为被加工材料, 用PCBN刀具通过对HRC30~HRC64范围内5种不同硬度材料的切削试验研究,首次得到了工件材料硬度HRC50是区分普通切削与硬态
随着现代社会信息化的发展,网络应用的普及,使得信息流动性相较以往大大提升,信息载体、 信息获得的方式也与传统方式大不相同,然而种种变革在提升经济活动效率的同时也带来
该文论述了一种适应企业综合自动化发展的企业信息系统模型,即在由现场总线控制网络与Intranet、Internet互连构成的WAN/LAN/Fieldbus形式的企业网络结构上,通过各层之间交换
该文利用单片机技术设计了自动焊机的最重要的部分示教盒.该文还根据自动焊机的特点建立了适合该系统的数学模型.论文对旋转轴进行了设计和分析,根据系统的工作特点和给定的
该文首先介绍了该实验用电流变液的性质及配制方法,然后研究了电流变液的连续挤压特性,实验表明:随着外加电场强度的增大,电流变液的抗压应力也随之增大,同时,电流变液的刚度