MaxQ相关论文
分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中......
详细介绍了由Intergrated Products和Dallas Semiconductor合作设计的微控制器MAXQ的指令系统的指令格式和特点及其主要硬件资源的......
强化学习是机器学习领域的一个重要分支,但在强化学习系统中,学习的数量会随着状态变量的个数成指数级增长,从而形成“维数灾”。为此......
随着计算机网络技术的发展,Web应用已经渗透到社会的各个应用领域。在市场需求推动下,Web应用的规模越来越大,结构也变得越来越复......
对于较大规模的多智能体决策规划问题,用传统的基于Markov决策过程的方法一般很难解决。本文研究完全分布式控制方式、存在部分感......