搜索筛选:
搜索耗时0.0926秒,为你在为你在102,285,761篇论文里面共找到 1 篇相符的论文内容
类      型:
[会议论文] 作者:蔡文澜[1]王俊生[2]陶军[3]徐惠斌[3]马宏绪[4], 来源:中国仪器仪表学会第九届青年学术会议 年份:2007
尽管策略梯度增强学习算法克服了值函数增强学习算法不能保证收敛的缺点,但是在梯度估计过程中,方差过大,影响了学习性能。PEGASUS策略梯度增强学习算法通过把随机性问题转化...
相关搜索: