基于强化学习的多机器人合作行为获取

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:mysticlisten
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了基于强化学习的多机器人学习社会合作行为的问题.通过定义的分配布尔矩阵,对参与任务者进行奖励回报,并综合基础行为,生成状态到行为的新的映射,形成高级的群体合作行为,使得团队作为一个整体受益.讨论了学习社会行为的可行性和必要性,并采用强化学习方法,给出了多机器人传接合作搬运的详细算法实现.
其他文献
针对一类数学模型不完全确知并包含外部扰动的非线性多变量系统,提出一种模糊神经网络(FNN)自适应控制策略.用FNN模型在线辨识非线性系统的未知动态,并根据误差系统的Riccati
本文对PYRENEES FPSO项目的危险区划分采用IP15标准.选取PYRENEES FPSO操作压力超过100 bar的三级压缩机二次冷却系统,利用DNV PHAST软件进行了可燃气体扩散模拟,为后续的危
对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2 000篇网上新闻
在半导体产业的发展中,一般将Si、Ge称为第1代电子材料;而将GaAs、InP、GaP、InAs、AlAs及其合金等称为第2代电子材料;宽禁带(Eg>2.3eV)半导体材料近年来发展十分迅速,成为第
期刊
将小波神经网络优良的分类诊断能力和最小二乘加权融合方法相结合,采用油气分析实现电力变压器的故障诊断.用非线性Morlet小波基作为神经网络激励函数,形成神经元,结合双方的
课程开发的知识选择问题是教育理论与实践中的重要问题。农村学前课程开发的知识选择是在农村独特的背景下进行的,是指在一定的课程开发理念的指导下,为了满足农村学前儿童身
将河流动力学与数学中的分形理论相结合,以河床冲淤较为剧烈的三峡坝下游典型分汊河段为例,分析了河床表面分形维数(BSD)的变化及其与相应河段平面、纵剖面、横断面冲淤调整特
2011年12月16日,长江科学院流域水环境研究所在武汉组织召开水利部公益性行业科研专项项目“农村水电生态环境影响评价及保护对策研究”2011年度工作总结会议。项目参加单位国
为了实现安全的电子支付,基于代理签名方案和Brands电子现金系统,设计了一种新的多银行电子现金系统.通过分析表明,由于引入了代理签名方案,新方案可以方便地取消发币银行的
在此次新冠肺炎疫情报道中,短视频作为一种新的产品形式深度参与其中,成为本次疫情报道一大亮点。基于人民日报社、新华社、中央广播电视总台、中国日报四家国家级主流媒体在