近端策略优化(PPO)相关论文
针对认知无线网络(Cognitive Radio Network,CRN)中的频谱切换问题,提出了一种基于强化学习的近端策略优化(Proximal Policy Optim......
期刊
强化学习是一类用于学习策略的机器学习方法,通过模拟人的学习过程,与所处环境不断交互来学习动作策略,用以获得最大累积回报.以设......