在线策略迭代相关硕士博士期刊学术论文

针对导弹末制导拦截系统，建立了导弹-目标相对运动非线性模型，将导弹-目标拦截问题转化为非线性系统微分博弈问题。考虑到Hamilton-J......

期刊

Q学习等强化学习技术是解决一类离散事件动态系统优化问题的有效方法，已经广泛应用到各类实际问题的研究中，特别是可拓展到可用半Mar......

学位

研究单站点传送带给料生产加工站（conveyor-serviced production station,CSPS）系统的前视（look-ahead）距离最优控制问题,以提高系统的......

期刊