基于强化学习的多机器人合作行为获取

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:mysticlisten
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了基于强化学习的多机器人学习社会合作行为的问题.通过定义的分配布尔矩阵,对参与任务者进行奖励回报,并综合基础行为,生成状态到行为的新的映射,形成高级的群体合作行为,使得团队作为一个整体受益.讨论了学习社会行为的可行性和必要性,并采用强化学习方法,给出了多机器人传接合作搬运的详细算法实现.
其他文献
针对一类数学模型不完全确知并包含外部扰动的非线性多变量系统,提出一种模糊神经网络(FNN)自适应控制策略.用FNN模型在线辨识非线性系统的未知动态,并根据误差系统的Riccati
本文对PYRENEES FPSO项目的危险区划分采用IP15标准.选取PYRENEES FPSO操作压力超过100 bar的三级压缩机二次冷却系统,利用DNV PHAST软件进行了可燃气体扩散模拟,为后续的危
课程开发的知识选择问题是教育理论与实践中的重要问题。农村学前课程开发的知识选择是在农村独特的背景下进行的,是指在一定的课程开发理念的指导下,为了满足农村学前儿童身
将河流动力学与数学中的分形理论相结合,以河床冲淤较为剧烈的三峡坝下游典型分汊河段为例,分析了河床表面分形维数(BSD)的变化及其与相应河段平面、纵剖面、横断面冲淤调整特
为了实现安全的电子支付,基于代理签名方案和Brands电子现金系统,设计了一种新的多银行电子现金系统.通过分析表明,由于引入了代理签名方案,新方案可以方便地取消发币银行的
在此次新冠肺炎疫情报道中,短视频作为一种新的产品形式深度参与其中,成为本次疫情报道一大亮点。基于人民日报社、新华社、中央广播电视总台、中国日报四家国家级主流媒体在