搜索与陶钊榕相关的论文

搜索筛选:

搜索耗时0.0335秒,为你在为你在23,761,000篇论文里面共找到 3 篇相符的论文内容

类型:

全部期刊学位会议报纸英文

发布年度:

全部 2025 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008 2007 2006 2005 2004 更早

排序方式:

相关性最新发表最早发表

平均报酬准则下的逆向强化学习算法研究

[学位论文] 作者：陶钊榕,, 来源：哈尔滨工业大学年份：2013

强化学习中报酬函数主要是根据经验人为设定的，难以保证最优性，学徒学习同样需要求取报酬函数。逆向强化学习通过学习演示轨迹或专家策略去构造潜在报酬函数，为报酬函数的自动构......

下载此文

基于性能灵敏度的逆向强化学习

[会议论文] 作者：陶钊榕, 陈智超, 李衍杰,, 来源：年份：2004

逆向强化学习是指通过专家行为获取潜在报酬函数的过程,进而可利用强化学习等优化理论得到最优的控制策略,因而可以实现对专家行为的模仿。本文从性能灵敏度分析的角度研究了...

下载此文

应用GNSS定位数据的微小卫星自主导航方案设计

[期刊论文] 作者：刘燎, 吴爱国, 陶钊榕, 孙华苗, 谢成清,, 来源：航天器工程年份：2019

为了提高微小卫星的自主能力,设计应用全球卫星导航系统(GNSS)定位数据的微小卫星自主导航方案,可进行自主轨道确定和轨道预报。GNSS接收机生成的定位数据发送给自主导航模块...

下载此文