搜索筛选:
搜索耗时1.1836秒,为你在为你在102,285,761篇论文里面共找到 2 篇相符的论文内容
类      型:
[学位论文] 作者:程玉虎, 来源:中国科学院自动化研究所 年份:2005
作为一类具有多学科交叉特点的机器学习方法,强化学习在复杂的决策优化和控制问题中具有广泛的应用背景。但对于大规模或连续状态和动作空间的马氏决策问题,强化学习面临着“维......
[期刊论文] 作者:程玉虎,易建强,王雪松,赵冬斌, 来源:电机与控制学报 年份:2005
针对连续状态与动作空间下的控制问题,提出了一类连续状态与动作空间下的加权Q学习算法,应用改进的增长神经气算法动态构建径向基网络的隐含层,实现状态空间的自适应构建.在...
相关搜索: