深度确定性策略梯度法相关论文
针对交直流混合微电网优化调度中的不确定性建模难和复杂系统难以高效求解等问题,提出了一种通过人工策略引导提高智能体学习效率的......
近年来,随着我国城市轨道交通的迅速发展和众多地铁站的快速建设、运营,其相应的能耗总量也迅速增长,能耗问题日益凸显。为了给乘......
针对无人机(unmanned aerial vehicle,UAV)航路终端约束情况下航路自主引导机动控制决策问题,采用Markov决策过程模型建立UAV自主......