改进的CE-Q算法用于多Agent觅食的研究

来源 :机械设计 | 被引量 : 0次 | 上传用户：wlh0403

【摘要】

：

针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入

【作者】

：

雷默涵杨萍

【机构】

：

兰州理工大学机电工程学院,

【出处】

：

机械设计

【发表日期】

：

2015年06期

【关键词】

：

系统效率动作过程奖赏 Agent 任务过程对策论计算复杂度真实试验缺乏理性学习方法其在

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述问题,并在执行任务过程中对Agent进行指导,很好地提高了系统效率。最后以多Agent觅食为任务,Matlab为平台进行仿真实试验,并与普通CE-Q及FF-Q算法进行对比,验证了其在复杂环境下对于多Agent系统的有效性和优越性。 Aiming at the problems such as lack of rationality, difficulty in guaranteeing convergence, high computational complexity and low efficiency in the multi-agent tasks in complex environment, many reinforcement learning methods under the framework of game theory are used. In the basic theory of CE-Q, The CE-Q improvement and reinforcement algorithm that adds instant reward to the action process is proposed to effectively improve the above-mentioned problems and to guide the Agent in the process of carrying out the task, which improves the system efficiency. At last, taking the multi-agent foraging as the task, Matlab carries on the simulation test for the platform, and compares it with the common CE-Q and FF-Q algorithms to verify its effectiveness and superiority to the multi-agent system under complicated environment.

其他文献

从数字看中国共产党

党员队伍结构1921年中国共产党诞生时,只有五十几名党员。81年后的今天,中国共产党已成为在全国执政53年并拥有6600多万党员的大党。中国共产党的党员队伍不断壮大,结构日趋

期刊

中共一大干部队伍领导干部领导班子配备纪检工作干部总数少数民族干部领导班子建设从严治党领导骨干

勇于开展批评与自我批评

我们有些单位的民主生活会存在“四多四少”现象,即谈工作多、谈思想少;谈成绩多,谈问题少:谈客观原因多,谈主观原因少;相互表扬多,相互批评少。究其原因,主要是没有认真开

期刊

批评与自我批评民主生活会四多要虚心领导干部违纪行为农五师批评意见改正措施锐利武器

论纪实手法在电视新闻中的运用

近年来,随着电视数字技术的飞速发展和观众欣赏口味的变化,纪实手法成为荧屏上一种主流的叙事手段。我们需要从增加电视节目的贴近性和可视性的要求出发,对纪实手法在电视新

期刊

纪实手法电视新闻欣赏口味数字技术场景变化叙事手段消息类新闻现场画面语言现场报道

海口创新公开选拔机制

自1996年来,海口市共提拔处级领导干部134名,其中通过公开选拔上岗的就有102名,提拔任用科级干部337名,其中330名是通过竞争上岗的。干部任用这一传统上的“秘密工作”,在

期刊

选拔机制干部任用提拔任用领导干部干部人事制度阳光工程工作作风干部思想工作选拔过程处级干部

治国当以民生为上

12月12日,新一届中央政治局常委会专门听取了有关部门关于解决困难群众生产生活问题的汇报,并对此进行了研究部署。新一届的中央领导集体刚刚部署完明年的经济工作,紧接着

期刊

中央领导政治局常委会领导干部工作作风经济发展体察民情体制改革工作方法市场竞争

为强军兴军提供思想引领和舆论支持

我国新闻评论的历史明确显示,社会发展转型最为强烈的时期,往往是媒体评论最为活跃的时期,也是最容易出评论大家的时期。改革开放以来,特别是近年来,评论与社会政治生态、文

期刊

社会发展转型媒体环境互动关系文化环境人民前线新闻干事前所解放军报社政治生态新闻报道

改进领导作风必须强化“六种意识”

本文认为,改进领导作风是新时期党风建设的关键环节。为了改进领导作风,必须强化“六种意识”:一是政治意识;二是宗旨意识;三是民主意识;四是全局意识;五是纪律意识;六是表率

期刊

领导作风领导干部党风建设领导机关生活作风违反党纪思想作风执行党驾驭全局批评与自我批评

关于私营企业主作为我们党的群众基础问题研究

正确认识和对待私营企业主 ,是一个重大的理论问题和实践问题。必须用马克思主义的观点和方法 ,分析和认识私营企业主作为我们党的群众基础的问题。 Correctly understandin

期刊

私营企业主阶级阶层党的建设党的基本路线阶层关系党的性质社会结构企业干部思想路线先锋模范作用

新疆大量淘汰小煤矿促进煤炭产业结构优化升级

新疆维吾尔自治区为了促进煤炭产业结构优化升级,多年来进行资源整合、淘汰落后产能。从2009年起,这一步伐将明显加快,至2010年,天山南北将仅保留250个小煤矿。据自治区煤炭

期刊

煤炭产业结构煤炭工业管理天山南北煤炭资源资源浪费产能采煤机械化煤矿安全重点煤矿煤电煤化工

粗糙软环的运算与特征

在粗糙软集的基础上提出粗糙软环的概念,并讨论了其相关的运算性质,同时通过例子论证了相应的结论。最后,刻画了粗糙软环的一个重要特征。 On the basis of rough soft sets

期刊

粗糙软集粗糙软环近似空间等价关系不确定性知识知识约简子环运算性质近似算子下近似集

改进的CE-Q算法用于多Agent觅食的研究

与本文相关的学术论文