资格迹相关论文
强化学习是机器学习的一个重要分支,它模拟动物学习过程,通过试探的方法修正从状态到动作的映射策略,最终学会在各种环境状态下采......
针对云计算领域的资源调度这一问题,国内外学者提出了多种云资源调度模型对其进行求解,但是在实际应用过程中会存在不确定性,因此......
针对非线性系统控制中具有的连续状态和未知系统模型的问题,提出一种基于ET-RBF(资格迹和径向基函数)的Sarsa学习控制策略.由于经......
提出一种带有资格迹的模糊CMAC控制器(FCE),资格迹的引入可以对控制系统进行超前预测,提高系统的稳定性。研究了FCE系统的构成,并......
近年来强化学习中的策略梯度方法以其良好的收敛性能吸引了广泛的关注。研究了平均模型中的自然梯度算法,针对现有算法估计梯度时......
Q(λ)学习算法是一种结合值迭代与随机逼近的思想的基于模型无关的多步离策略强化学习算法.针对经典的Q(λ)学习算法执行效率低、收敛速......
针对具有连续状态和未知系统模型的非线性系统控制问题,提出一种基于Elman神经网络的Q学习控制策略.利用Elman网络良好的动态特性及......
在对资格迹理论研究的基础上,提出了一种延迟快速强化学习算法DFSARSA(λ)(延迟快速SARSA(λ)算法).算法的主要思想是通过对资格迹......
本文研究具有人机交互能力的强化学习算法。通过人机交互给出操作者对学习结果的性能评价,智能体系统能获得当前状态与目标状态距......
人眼视觉估计是预测视线方向、定位注视点位置的过程。人眼视觉估计具有重大的研究价值和应用价值,被广泛应用在神经科学、心理学......
提出了一种分散式多智能体均衡算法(decentralized correlated equilibrium Q(?),DCEQ(λ))以解决新能源接入所带来的强随机环境下......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
强化学习是解决自适应问题的重要方法,被广泛地应用于连续状态下的学习控制,然而存在效率不高和收敛速度较慢的问题.在运用反向传......
针对两轮自平衡机器人的运动平衡控制问题,提出了基于Skinner操作条件反射理论的BP神经网络与资格迹相结合的仿生自主学习算法作为......