单agent相关论文
Agent是一个具有自主性、交互性、协同性和智能性等特性的内部驱动的软件实体,它能作用于自身和环境,并能对环境做出适应性的反应,......
强化学习的研究需要解决的重要难点之一是:探索未知的动作和采用已知的最优动作之间的平衡。贝叶斯学习是一种基于已知的概率分布和......