时间差分学习相关论文
实际工程应用中,由于生产需要、工况变化或紧急的突发状况,系统包含着多种工作模式,既有随时间的状态连续演化,又有受离散时间驱动......
计算机博弈曾一直被称为是人工智能研究的“果蝇”,但对于有几千年历史的中国象棋的计算机博弈的研究却远远落后于其它棋类,为了改变......
<正>The last few decades have seen a phenomenal increase in the quality,diversity and pervasiveness of computer games.Th......
摘要:本文从研究深度学习出发,提出深度学习在增强学习领域能被高等教育借鉴的三种重要算法:时间差分学习、优先经验回放、创新指数,通......