Actor-Critic方法相关论文
近年来随着船舶执行的任务越来越复杂,人们对欠驱动船舶自动控制系统提出了更高的要求。自动靠泊系统是实现高效安全航行所不可或......
针对SAC(Soft Actor Critic)算法中所有样本都以等概率随机采样,造成训练速度慢,训练过程不稳定的缺点,提出了PER(Prioritized Exp......