搜索筛选:
搜索耗时0.7677秒,为你在为你在102,285,761篇论文里面共找到 1 篇相符的论文内容
类      型:
[学位论文] 作者:朱昶熹,, 来源:华南理工大学 年份:2004
强化学习被广泛应用于解决序列决策任务。然而,强化学习算法的样本利用效率较低,并需要很长时间来学习合适的策略,特别是当多个智能体在没有先验知识的情况下开始学习。该问...
相关搜索: