搜索筛选:
搜索耗时0.7337秒,为你在为你在102,285,761篇论文里面共找到 1 篇相符的论文内容
类      型:
[期刊论文] 作者:刘川莉, 蔡乐才, 高祥, 居锦武, 吴昊霖,, 来源:四川理工学院学报(自然科学版) 年份:2019
深度Q神经网络算法的值函数迭代算法大多为Q学习算法,这种算法使用贪婪值函数作逼近目标,不利于深度Q神经网络算法获得长期来看更好的策略。通过以期望思想求解的期望值函数...
相关搜索: