搜索筛选:
搜索耗时0.0849秒,为你在为你在102,285,761篇论文里面共找到 2 篇相符的论文内容
类      型:
[期刊论文] 作者:多南讯, 吕强, 林辉灿, 卫恒,, 来源:机器人 年份:2004
首先,对深度强化学习(DRL)的兴起与发展进行了回顾.然后,将用于高维连续动作空间的深度强化学习算法分为基于值函数近似的算法、基于策略近似的算法以及基于其他结构的算法3...
[期刊论文] 作者:王钦钊, 多南讯, 吕强, 杨奇东, 来源:装甲兵学报 年份:2022
针对非合作博弈模型不能准确描述战场环境下多智能体间的协作对抗关系,详细阐述博弈模型之间的关系,对比合作博弈模型与非合作博弈模型间的异同研究战场环境下多智能体间的博弈关系,将多智能体协作对抗问题建模为合作博弈模型并通过强化学习方法进行求解,最后并......
相关搜索: