搜索筛选:
搜索耗时1.1091秒,为你在为你在102,285,761篇论文里面共找到 4 篇相符的论文内容
类      型:
[会议论文] 作者:段家庆,陈宗海, 来源:2006系统仿真及其应用学术交流会 年份:2006
本文对模糊定性仿真与灰色定性仿真进行了研究。文章介绍了模糊定性仿真和灰色定生仿真两种定性定量仿真方法,并对它们进行了对比分析。...
[会议论文] 作者:段家庆,黄元亮,王雷,陈宗海, 来源:2003系统仿真技术及其应用学术交流会 年份:2003
摆动变量是QSIM算法产生奇异行为的主要原因之一.文[4]的作者分析了Kuipers的高阶导数约束理论,指出了其中存在的问题并提出了改进方法,有效地利用了系统常识和QDE中蕴含的定...
[会议论文] 作者:陈宗海,段家庆,任燚,罗杨宇,李成荣, 来源:2008系统仿真技术及应用学术会议 年份:2008
针对传统强化学习算法在执行学习任务时只在完成一系列动作后获得奖赏,不能对每个动作进行奖赏分配,无法满足复杂实时任务的要求。本文提出了过程奖赏Course Reward-CR,关心的是完成任务过程中的每个动作和趋势,实时对其进行奖赏.并提出了一种基于过程奖赏和优先扫除......
[会议论文] 作者:陈宗海[1]段家庆[1]任燚[1]罗杨宇[2]李成荣[2], 来源:'2008系统仿真技术及应用学术会议 年份:2008
针对传统强化学习算法在执行学习任务时只在完成一系列动作后获得奖赏,不能对每个动作进行奖赏分配,无法满足复杂实时任务的要求。本文提出了过程奖赏Course Reward-CR,关心的是......
相关搜索: