【摘 要】
:
可回收运载火箭的着陆制导需要严格保证着陆位置、速度精度,并尽量减小燃料消耗。基于最优控制的着陆制导方法需要依赖火箭精确模型,不具有对模型偏差的泛化能力。针对此问题,本文基于强化学习方法,通过不基于模型的交互采样,训练了神经网络形式的火箭着陆制导策略。首先,建立火箭着陆制导问题的马尔可夫决策过程模型,根据终端约束和燃料消耗指标设计了分阶段奖励函数;然后,在此基础上设计了多层感知机制导策略网络,并使用不基于模型的邻近策略优化算法,通过与火箭着陆制导马尔可夫决策过程的交互采样,实现对制导策略网络的迭代优化;最后
【机 构】
:
北京航空航天大学宇航学院,北京航天自动控制研究所
论文部分内容阅读
可回收运载火箭的着陆制导需要严格保证着陆位置、速度精度,并尽量减小燃料消耗。基于最优控制的着陆制导方法需要依赖火箭精确模型,不具有对模型偏差的泛化能力。针对此问题,本文基于强化学习方法,通过不基于模型的交互采样,训练了神经网络形式的火箭着陆制导策略。首先,建立火箭着陆制导问题的马尔可夫决策过程模型,根据终端约束和燃料消耗指标设计了分阶段奖励函数;然后,在此基础上设计了多层感知机制导策略网络,并使用不基于模型的邻近策略优化算法,通过与火箭着陆制导马尔可夫决策过程的交互采样,实现对制导策略网络的迭代优化;最后
其他文献
针对快速搜索随机树(rapidly-exploring random tree,RRT)路径规划算法存在的随机性大、搜索效率低等问题,结合强化学习可根据先验知识选择策略的特点,提出了一种基于深度Q网络(deep Q-network,DQN)的改进RRT优化算法。首先设计复数域变步长的避障策略,并建立RRT算法中随机树生长的马尔科夫决策过程(Markov decision process,MDP)模
针对未来无人化、智能化、体系化的作战环境,介绍马赛克战概念的提出背景,指出其与观察-调整-决策-执行(Observe-Orient-Decide-Act,OODA)循环理论、决策中心思想的联系,分析马赛克战的核心理念以及在作战层面和体系建设层面的运用思路。从网络化信息共享、通信的指挥控制和智能化混合型决策等方面出发,总结支撑马赛克部队智能化作战的关键技术,结合马赛克战在作战隐蔽性、灵活性等方面的优势和在通信传输、指挥控制、后勤保障等方面的不足,以延迟和阻断马赛克战的OODA快速闭环为目的,从电磁频谱对抗、
针对滑翔飞行器气动外形与轨迹一体化设计优化问题,提出一种基于序列代理优化的有效设计优化方法。为了获得滑翔飞行器的气动特性参数,提出了一种气动外形参数化建模方法,并基于非结构三角形面元法和流线追踪技术实现了粘性气动系数的计算。为了获得给定气动外形方案下的最大航程,采用自适应Legendre-Gauss-Radau伪谱法进行了求解。为了提升气动外形与轨迹一体化设计优化的效率,提出了一种基于Kriging代理模型的多采样点高效全局优化算法,并进行了数值校验。计算结果表明:该算法能够有效求解多约束条件下的滑翔飞行
微弱目标群检测是目标检测领域中的难点,随着传感技术发展使得基于多模态数据融合的目标检测方法成为可能。传统的方法常常关注于人工设计的多模态数据融合层面,一般采用信号级及决策级的融合,无法充分利用多模态内在融合特征。为此,为了充分利用深度卷积网络的内在多模态特征表达能力,提出一种端到端多模态数据学习融合网络,能够融合学习可见光、红外和多普勒脉冲雷达数据。在FLIR_ADAS数据集上验证算法识别微弱目标
为了降低传统迭代算法在求解变循环发动机非线性模型时对初值的依赖性,将模型的求解问题转换为求最小值的优化问题,引入差分进化算法进行模型的求解,并提出一种自适应差分进化算法。自适应差分进化算法借助轮盘赌选择法,利用种群的进化经验可以自适应地选择最适合当前种群的差分策略与算法控制参数。针对变循环发动机四个典型工作点的模型求解问题,研究了标准差分进化算法的控制参数对其性能的影响,获取了标准差分进化算法在求解四个典型工作点时的最优控制参数组合,对比分析了自适应差分进化算法与标准差分进化算法的性能差异,最后研究了种群
在介绍高强韧稀土镁合金(Mg-RE)大型复杂铸件研制技术瓶颈的基础上,指出了制造过程中熔体纯净化/细化孕育与熔体纯净化/成分均匀化之间的相互制约以及铸件本体强韧性不足的影响因素,综述了国内外稀土镁合金熔体纯净化、细化孕育、均匀化、凝固组织模拟与调控、缺陷抑制、热处理组织调控等技术的研究现状。明确了未来研究需要关注的两大科学问题:解决大熔量稀土镁合金熔体“均匀化-纯净化-细化孕育”冶金交互作用机理,稀土镁合金大型复杂铸件“溶质场-流动场-能量场”传输规律及其对组织和缺陷演变的影响机理。
主要介绍了美军武器装备作战需求生成机制,对比分析了我国在武器装备作战需求生成机制方面的问题,运用系统工程化的思想对武器装备作战需求生成问题进行了探讨,对我国建立装
通过实验发现振动的节流通道会引起碳氢燃料的不稳定流动现象。为了探究节流通道振动引发碳氢燃料不稳定流动的机理,采用数值求解三维Reynold-Averaged Navier-Stokes(RANS)方程和k-ω湍流模型的方法研究了节流通道振动对流场动态特性的影响,重点关注节流通道振动对扩张结构附近流动分离的动态特性的影响。数值模拟节流结构两端压差与实验数据对比,验证了所采用的数值方法和湍流模型的有效性。结果表明,当燃油流动方向和节流通道振动方向一致时,会发生不稳定流动现象。当燃油流动方向和节流通道振动方向垂
为了研究三级旋流燃烧室的流动以及预燃级非预混燃烧特性,设计了三级旋流燃烧室试验结构方案与光学非接触测量方案,研究了总压损失与当量比对三级旋流燃烧室流动特性及火焰结
为研究风电机组中空夹层钢管混凝土塔筒钢板在轴压荷载作用下的稳定性能,完成了1片中空夹层钢管混凝土塔筒缩尺试件的轴压试验,得到了内、外钢板的局部失稳破坏模式及稳定性能承载能力。采用ABAQUS建立了试件的有限元模型,模拟结果与试验得到的破坏模式和荷载-位移曲线吻合良好。在此基础上进一步开展了有限元参数分析,研究了钢板曲率半径、钢板屈服强度、钢板厚度、栓钉竖向间距等参数对中空夹层钢管混凝土塔筒钢板在轴压荷载下峰值强度的影响规律,并对比了参数敏感性以找出关键设计变量,为构件设计方法的研究奠定基础。以期推动基于边