搜索与程玉虎相关的论文

搜索筛选:

搜索耗时1.1836秒,为你在为你在102,285,761篇论文里面共找到 2 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 2003 更早

排序方式:

相关性最新发表最早发表

连续状态—动作空间下强化学习方法的研究

[学位论文] 作者：程玉虎, 来源：中国科学院自动化研究所年份：2005

作为一类具有多学科交叉特点的机器学习方法，强化学习在复杂的决策优化和控制问题中具有广泛的应用背景。但对于大规模或连续状态和动作空间的马氏决策问题，强化学习面临着“维......

下载此文

一类连续状态与动作空间下的加权Q学习

[期刊论文] 作者：程玉虎,易建强,王雪松,赵冬斌, 来源：电机与控制学报年份：2005

针对连续状态与动作空间下的控制问题,提出了一类连续状态与动作空间下的加权Q学习算法,应用改进的增长神经气算法动态构建径向基网络的隐含层,实现状态空间的自适应构建.在...

下载此文