MaxQ 相关硕士博士期刊学术论文

分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中......

期刊

详细介绍了由Intergrated Products和Dallas Semiconductor合作设计的微控制器MAXQ的指令系统的指令格式和特点及其主要硬件资源的......

期刊

MAXQ 微控制器指令集时钟周期

强化学习是机器学习领域的一个重要分支，但在强化学习系统中，学习的数量会随着状态变量的个数成指数级增长，从而形成“维数灾”。为此......

期刊

随着计算机网络技术的发展,Web应用已经渗透到社会的各个应用领域。在市场需求推动下,Web应用的规模越来越大,结构也变得越来越复......

学位

对于较大规模的多智能体决策规划问题,用传统的基于Markov决策过程的方法一般很难解决。本文研究完全分布式控制方式、存在部分感......

会议