搜索筛选:
搜索耗时2.4037秒,为你在为你在102,285,761篇论文里面共找到 4 篇相符的论文内容
类      型:
[学位论文] 作者:袁姣红, 来源:中南大学 年份:2011
强化学习因具有自学习和在线学习的良好特性,已经成为机器学习领域的一个重要分支。然而,智能体在大规模高维度的决策环境下进行强化学习时被“维数灾难”(学习参数的个数随...
[会议论文] 作者:袁姣红,吴敏, 来源:湖南省第三届研究生创新论坛——信息与控制工程的新理论和新技术分论坛 年份:2010
为解决大规模强化学习中的“维度灾难”问题, 克服以往学习算法的性能高度依赖于先验知识或者探测程度的局限性,本文提出一种未知环境中基于概率模型的动态分层强化学习方法。......
[期刊论文] 作者:袁姣红,谌晓明, 来源:电信技术 年份:2019
附着成功率是反映LTE核心网络健康状况的一项重要指标,若附着成功率较低,将会导致较多用户无法正常注册LTE网络,严重影响客户的使用感知。文中提出一种跨专业的LTE网络附着成...
[期刊论文] 作者:戴朝晖,袁姣红,吴敏,陈鑫,, 来源:控制理论与应用 年份:2011
为解决大规模强化学习中的"维度灾难"问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层强化学习方法.首先基于贝叶斯学习对状态转......
相关搜索: