改进的CE-Q算法用于多Agent觅食的研究

来源 :机械设计 | 被引量 : 0次 | 上传用户:wlh0403
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述问题,并在执行任务过程中对Agent进行指导,很好地提高了系统效率。最后以多Agent觅食为任务,Matlab为平台进行仿真实试验,并与普通CE-Q及FF-Q算法进行对比,验证了其在复杂环境下对于多Agent系统的有效性和优越性。 Aiming at the problems such as lack of rationality, difficulty in guaranteeing convergence, high computational complexity and low efficiency in the multi-agent tasks in complex environment, many reinforcement learning methods under the framework of game theory are used. In the basic theory of CE-Q, The CE-Q improvement and reinforcement algorithm that adds instant reward to the action process is proposed to effectively improve the above-mentioned problems and to guide the Agent in the process of carrying out the task, which improves the system efficiency. At last, taking the multi-agent foraging as the task, Matlab carries on the simulation test for the platform, and compares it with the common CE-Q and FF-Q algorithms to verify its effectiveness and superiority to the multi-agent system under complicated environment.
其他文献
党员队伍结构1921年中国共产党诞生时,只有五十几名党员。81年后的今天,中国共产党已成为在全国执政53年并拥有6600多万党员的大党。中国共产党的党员队伍不断壮大,结构日趋
我们有些单位的民主生活会存在“四多四少”现象,即谈工作多、谈思想少;谈成绩多,谈问题少:谈客观原因多,谈主观原因少;相互表扬多,相互批评少。究其原因,主要是没有认真开
近年来,随着电视数字技术的飞速发展和观众欣赏口味的变化,纪实手法成为荧屏上一种主流的叙事手段。我们需要从增加电视节目的贴近性和可视性的要求出发,对纪实手法在电视新
自1996年来,海口市共提拔 处级领导干部134名,其中 通过公开选拔上岗的就有102名,提拔任用科级干部337名,其中330名是通过竞争上岗的。干部任用这一传统上的“秘密工作”,在
12月12日,新一届中央政治局常委会专门听取了有关部门关于解决困难群众生产生活问题的汇报,并对此进行了研究部署。 新一届的中央领导集体刚刚部署完明年的经济工作,紧接着
我国新闻评论的历史明确显示,社会发展转型最为强烈的时期,往往是媒体评论最为活跃的时期,也是最容易出评论大家的时期。改革开放以来,特别是近年来,评论与社会政治生态、文
本文认为,改进领导作风是新时期党风建设的关键环节。为了改进领导作风,必须强化“六种意识”:一是政治意识;二是宗旨意识;三是民主意识;四是全局意识;五是纪律意识;六是表率
正确认识和对待私营企业主 ,是一个重大的理论问题和实践问题。必须用马克思主义的观点和方法 ,分析和认识私营企业主作为我们党的群众基础的问题。 Correctly understandin
新疆维吾尔自治区为了促进煤炭产业结构优化升级,多年来进行资源整合、淘汰落后产能。从2009年起,这一步伐将明显加快,至2010年,天山南北将仅保留250个小煤矿。据自治区煤炭
在粗糙软集的基础上提出粗糙软环的概念,并讨论了其相关的运算性质,同时通过例子论证了相应的结论。最后,刻画了粗糙软环的一个重要特征。 On the basis of rough soft sets