搜索与多南讯相关的论文

搜索筛选:

搜索耗时0.0849秒,为你在为你在102,285,761篇论文里面共找到 2 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

[期刊论文] 作者：多南讯, 吕强, 林辉灿, 卫恒,, 来源：机器人年份：2004

首先,对深度强化学习(DRL)的兴起与发展进行了回顾.然后,将用于高维连续动作空间的深度强化学习算法分为基于值函数近似的算法、基于策略近似的算法以及基于其他结构的算法3...

下载此文

基于强化学习的多智能体合作博弈对抗算法

[期刊论文] 作者：王钦钊, 多南讯, 吕强, 杨奇东, 来源：装甲兵学报年份：2022

针对非合作博弈模型不能准确描述战场环境下多智能体间的协作对抗关系,详细阐述博弈模型之间的关系,对比合作博弈模型与非合作博弈模型间的异同研究战场环境下多智能体间的博弈关系,将多智能体协作对抗问题建模为合作博弈模型并通过强化学习方法进行求解,最后并......

下载此文