多智能体协作的两层强化学习实现方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:tomyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了多智能体协作的两层强化学习方法.该方法主要通过在单个智能体中构筑两层强化学习单元来实现,将该方法应用于3个智能体协作抬起圆形物体的计算机模拟中,结果表明比采用传统强化学习方法的智能体协作得更好.
其他文献
思维训练的好方法──串讲鹤岗市十九中学李金香“串讲”就是将一类习题一起讲解.突出其解题思路和解题步骤的共同点.帮助学生抓住本质联系,从而提高学生的抽象概括水平.采用串讲
以概括同意发生发展为研究对象,通过美国《通用法则》关于概括同意的内容修订历程分析,比较概括同意与特定研究知情同意的伦理特征差异,试探讨在我国医疗机构施行概括同意的
目的:探讨乙状结肠代阴道成形术围术期的护理方法。方法:对12例乙状结肠代阴道成形术患者围术期给予精心观察与护理。结果:12例均手术成功,均无阴道出血、粘连、感染征象,阴道宽度
在过去的30年中,消化内镜的产生使消化道疾病的诊断和治疗发生了革命性的变化。近年来,不断发展的新器械和新技术使得内镜医生能够应用内镜方法治疗许多疾病,这在过去是不可
The minimum inhibitory concentration (MIC) is the concentration at which an antibacterial agent experiences the complete inhibition of organism growth. Bacterio
创伤性肠系膜上静脉血栓形成早期症状、体征不典型,诊断困难,容易误漏诊.我院1992年5月~2001年10月收治创伤性肠系膜上静脉血栓形成11例,初诊时均误诊,现分析如下.
为了建立齿廓为双圆弧齿面齿轮的三维模型,在建立刀具、面齿轮坐标系和坐标变换矩阵的基础上,利用微分几何和齿轮啮合原理推导了该面齿轮的齿面方程。根据此齿面方程利用Pro/E软
《3-6 岁儿童学习与发展指南》健康领域目标对幼儿发展中的“实施与指导的基本标准”第 7 条具体措施是: 检查场地器械,消除安全隐患;加强保护帮助,确保活动安全;培养规则意
This study characterizes the 19 kDa protein expressed by Mycobacterium avium subspecies paratuberculosis (MAP) as a glycolipoprotein, providing the foundation f
《文昌杂录》是北宋庞元英任尚书省主客郎中时撰写的一部笔记,庞元英,字懋贤,北宋单州成武(今属山东菏泽市成武县)人,为宰相庞籍第四子,恩荫入仕。《文昌杂录》所记内容起于元丰五年(公元1082年),终于元丰八年(公元1085年),原为六卷,末有补遗六条,故有书亦作七卷,成书后被历代藏书家、目录学家征引、收录,元明以来仅以钞本流传,入清后刻本渐行。现存主要有九种版本,其中以《学津讨原》本最为精详。《文昌