搜索与于丹宁相关的论文

搜索筛选:

搜索耗时1.8632秒,为你在为你在102,285,761篇论文里面共找到 3 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

基于值函数的深度强化学习改进研究

[学位论文] 作者：于丹宁, 来源：厦门大学年份：2020

深度强化学习作为机器学习的一个分支,其通过结合深度学习的感知能力与强化学习的决策能力实现了对从感知到行为端到端的学习。目前,基于值函数的深度强化学习相关研究已经在以高维感知数据为输入的序列决策任务中取得了巨大的成功,但仍面临值函数近似不准确、......

下载此文

基于记忆探索策略的有模型深度强化学习算法

[期刊论文] 作者：倪坤,刘云龙,于丹宁, 来源：微电子学与计算机年份：2021

深度强化学习在各个领域中都展现出了巨大的潜力,但现有的深度强化学习算法需要大量样本才能学习到一个较好的策略,而在实际场景中,深度强化学习样本通常存在数量少、成本高...

下载此文

基于循环卷积神经网络的POMDP值迭代算法

[期刊论文] 作者：于丹宁,倪坤,刘云龙, 来源：计算机工程年份：2021

基于卷积神经网络的部分可观测马尔科夫决策过程(POMDP)值迭代算法QMDP-net在无先验知识的情况下具有较好的性能表现,但其存在训练效果不稳定、参数敏感等优化难题。提出基于...

下载此文