基于强化学习的多机器人合作行为获取

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户：mysticlisten

【摘要】

：

研究了基于强化学习的多机器人学习社会合作行为的问题.通过定义的分配布尔矩阵,对参与任务者进行奖励回报,并综合基础行为,生成状态到行为的新的映射,形成高级的群体合作行

【作者】

：

李冬梅陈卫东席裕庚

【机构】

：

上海交通大学

【出处】

：

上海交通大学学报

【发表日期】

：

2005年8期

【关键词】

：

强化学习多机器人传接合作社会行为 reinforcement learning multi-robot relay cooperation soci

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

研究了基于强化学习的多机器人学习社会合作行为的问题.通过定义的分配布尔矩阵,对参与任务者进行奖励回报,并综合基础行为,生成状态到行为的新的映射,形成高级的群体合作行为,使得团队作为一个整体受益.讨论了学习社会行为的可行性和必要性,并采用强化学习方法,给出了多机器人传接合作搬运的详细算法实现.

其他文献

一类非线性多变量系统的模糊神经网络自适应控制

针对一类数学模型不完全确知并包含外部扰动的非线性多变量系统,提出一种模糊神经网络(FNN)自适应控制策略.用FNN模型在线辨识非线性系统的未知动态,并根据误差系统的Riccati

期刊

非线性多变量系统模糊神经网络自适应控制Lyapunov稳定H∞控制nonlinear multivariable system fuzzy-neuro

可燃气体扩散模拟在海上油气生产设施危险区划分中的应用

本文对PYRENEES FPSO项目的危险区划分采用IP15标准.选取PYRENEES FPSO操作压力超过100 bar的三级压缩机二次冷却系统,利用DNV PHAST软件进行了可燃气体扩散模拟,为后续的危

会议

海上油气生产可燃气体扩散模拟危险区划分IP15标准DNV PHAST软件

三种分类算法的实验比较

对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2 000篇网上新闻

期刊

分类算法K最近邻算法向量空间模型算法混合算法classification algorithmk nearest neighbors(kNN) vecto

GaN-第三代半导体的曙光

在半导体产业的发展中,一般将Si、Ge称为第1代电子材料;而将GaAs、InP、GaP、InAs、AlAs及其合金等称为第2代电子材料;宽禁带(Eg>2.3eV)半导体材料近年来发展十分迅速,成为第

期刊

一种基于油中溶解气体分析的变压器绝缘故障诊断新方法

将小波神经网络优良的分类诊断能力和最小二乘加权融合方法相结合,采用油气分析实现电力变压器的故障诊断.用非线性Morlet小波基作为神经网络激励函数,形成神经元,结合双方的

期刊

变压器故障诊断小波神经网络信息融合transformer fault diagnosis wavelet neural network informat

农村学前课程开发的知识选择:内涵、特征及策略

课程开发的知识选择问题是教育理论与实践中的重要问题。农村学前课程开发的知识选择是在农村独特的背景下进行的,是指在一定的课程开发理念的指导下,为了满足农村学前儿童身

期刊

农村学前教育课程开发知识选择

河床形态冲淤调整的分形度量

将河流动力学与数学中的分形理论相结合,以河床冲淤较为剧烈的三峡坝下游典型分汊河段为例,分析了河床表面分形维数（BSD）的变化及其与相应河段平面、纵剖面、横断面冲淤调整特

期刊

河流动力学河床表面分形维数河床形态度量river dynamics bed surface fractal dimension riverbed for

水利部行业专项“农村水电生态环境影响评价及保护对策研究”2011年度工作总结会在汉召开

2011年12月16日，长江科学院流域水环境研究所在武汉组织召开水利部公益性行业科研专项项目“农村水电生态环境影响评价及保护对策研究”2011年度工作总结会议。项目参加单位国

期刊

生态环境影响评价保护对策农村水电水利部行业长江科学院科研人员小水电中心

基于代理签名的多银行电子现金系统

为了实现安全的电子支付,基于代理签名方案和Brands电子现金系统,设计了一种新的多银行电子现金系统.通过分析表明,由于引入了代理签名方案,新方案可以方便地取消发币银行的

期刊

电子现金代理签名群签名electronic cash proxy signature group signature

价值认同与情感归属:主流媒体疫情报道的短视频生产

在此次新冠肺炎疫情报道中,短视频作为一种新的产品形式深度参与其中,成为本次疫情报道一大亮点。基于人民日报社、新华社、中央广播电视总台、中国日报四家国家级主流媒体在

期刊

主流媒体新冠疫情短视频内容生产

基于强化学习的多机器人合作行为获取

与本文相关的学术论文