搜索筛选:
搜索耗时0.0780秒,为你在为你在102,285,761篇论文里面共找到 6 篇相符的论文内容
类      型:
[期刊论文] 作者:郝钏钏,方舟,李平,, 来源:浙江大学学报(工学版) 年份:2013
现有的直接策略搜索强化学习控制算法大多是状态完全可观对象设计状态反馈控制策略,其适用的对象范围十分有限.为此,提出一种适用范围更广的模型参考输出反馈强化学习控制算...
[期刊论文] 作者:郝钏钏,方舟,李平,, 来源:华南理工大学学报(自然科学版) 年份:2012
使用定长情景进行学习的eNAC(episodic Natural Actor-Critic)算法是一种在理论上具有良好学习性能的强化学习控制算法,但其学习过程需要采样较多的定长情景,学习效率低.为此,...
[期刊论文] 作者:郝钏钏,方舟,李平,, 来源:上海交通大学学报 年份:2012
针对现有的基于强化学习的无人机航迹规划方法因无法充分考虑无人机的航迹约束而使规划获得的航迹可用性较差的问题,提出一种更有效的无人机三维航迹规划算法.该算法利用无人...
[会议论文] 作者:郝钏钏,方舟,李平, 来源:第23届过程控制会议 年份:2012
现有的基于Q学习的无人机航迹规划方法很少考虑无人机本身的航迹约束,导致规划获得的航迹的可用性较差。本文提出一种更有效的无人机三维航迹规划方法:利用无人机的航迹约束条件指导规划空间离散化过程,不仅在一定程度上降低了获得的离散规划问题的规模,而且在一定......
[期刊论文] 作者:郝钏钏, 司成, 周曼娟,, 来源:航天控制 年份:2004
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食Back to yield...
[期刊论文] 作者:王颖,唐明亮,郝钏钏,朱亮聪,冯继航,, 来源:深空探测学报(中英文) 年份:2020
随着人类探索太空的步伐愈加深入,利用多星组网进行深空探测的多目标轨道发射任务越来越多,针对性地提出一种适应多目标轨道要求的运载火箭弹道制导设计方法。创新性地提出只设计一条理论弹道,对其它目标轨道采用卫星入轨点位置不变的假设,根据不同的轨道要求生......
相关搜索: