搜索筛选:
搜索耗时1.8632秒,为你在为你在102,285,761篇论文里面共找到 3 篇相符的论文内容
类      型:
[学位论文] 作者:于丹宁, 来源:厦门大学 年份:2020
深度强化学习作为机器学习的一个分支,其通过结合深度学习的感知能力与强化学习的决策能力实现了对从感知到行为端到端的学习。目前,基于值函数的深度强化学习相关研究已经在以高维感知数据为输入的序列决策任务中取得了巨大的成功,但仍面临值函数近似不准确、......
[期刊论文] 作者:倪坤,刘云龙,于丹宁, 来源:微电子学与计算机 年份:2021
深度强化学习在各个领域中都展现出了巨大的潜力,但现有的深度强化学习算法需要大量样本才能学习到一个较好的策略,而在实际场景中,深度强化学习样本通常存在数量少、成本高...
[期刊论文] 作者:于丹宁,倪坤,刘云龙, 来源:计算机工程 年份:2021
基于卷积神经网络的部分可观测马尔科夫决策过程(POMDP)值迭代算法QMDP-net在无先验知识的情况下具有较好的性能表现,但其存在训练效果不稳定、参数敏感等优化难题。提出基于...
相关搜索: