搜索筛选:
搜索耗时0.0818秒,为你在为你在102,285,761篇论文里面共找到 2 篇相符的论文内容
发布年度:
[期刊论文] 作者:吴球业,
来源:信息系统工程 年份:2020
论文采用BP网络构建的Actor-Critic强化学习算法,解决了受扰单级倒立摆的平衡控制问题。控制算法包括Actor和Critic两个网络,其中Actor网络利用当前系统状态获得基于概率的输...
[学位论文] 作者:吴球业,,
来源:广东工业大学 年份:2020
自适应评判控制,也称自适应动态规划(Adaptive Dynamic Programming,ADP),融合了最优控制、神经网络和强化学习的思想,是最优控制领域新兴的近似最优方法,能有效克服动态规划“维数灾难”问题。随着经济、社会、工业等领域的发展,不断涌现的复杂非线性关联系统......
相关搜索: