基于深度强化学习的跳跃式小行星探测器规划策略研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sundianjusdyg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,小行星探测逐渐成为深空探测领域的一个较新的热门方向,因人们对小行星知之甚少,所以对其进行全方位的探测就显得尤为重要,其中就包括表面现场探测。小行星在体积和质量方面都比行星小得多,其微重力引力场环境给现阶段常用的车轮式探测器带来了极大的挑战,因此提出了采用跳跃式探测器来执行小行星表面的探测任务。目前,国内外对小行星着陆探测器的研究还处在初期阶段,其中更鲜有对探测器连续多次跳跃过程进行规划策略的研究。由于深度强化学习同时具备深度学习对事物的感知表达能力和强化学习对解决问题策略的学习能力,所以结合深度确定性策略梯度算法设计相应的神经网络对小行星探测器跳跃的完整过程进行规划。论文主要内容如下:首先对跳跃式小行星探测器进行了基础建模,并提出了一种简单的快速能量交换策略,旨在验证探测器能够通过碰撞过程实现能量转化。之后在结合深度确定性梯度算法的基础上进行神经网络和奖赏函数的设计,在不考虑飞轮控制能力的情况下对探测器碰撞运动规划策略进行学习,并在测试中有很好的表现。同时为了测试神经网络学到的探测器碰撞运动规划策略在小干扰地面环境下的鲁棒性,又将其在小角度斜面和随机土壤信息的两种环境下进行了测试,也都表现出了优秀的性能。为了研究探测器运动过程的爬坡能力,在较大角度斜面的环境下对神经网络结构进行了改进设计,将斜面信息作为单独的输入,结合到探测器碰撞运动规划策略中,对完成训练的新神经网络进行不同角度的斜面环境测试,同时对比测试原神经网络在相同斜面环境下的表现情况,两者性能变化整体趋势都随倾斜角度的增大而下降,但在大角度的斜面环境下,新神经网络的性能明显优于原神经网络。另外对神经网络在球形地面环境下进行了建模、训练与测试,即使改变了探测器状态空间的表示方式,仍然不影响其碰撞运动规划策略的学习。考虑飞轮控制能力,将飞轮信息作为探测器状态空间的一部分输入到神经网络中进行学习,发现其很难学到碰撞运动规划策略和飞轮控制能力之间的平衡关系,因此提出了一种飞轮卸载规划策略,在探测器与地面碰撞的过程中对飞轮进行卸载处理。通过对状态空间和奖赏函数的重新设计,神经网络能够较好地学到飞轮卸载规划策略,同时在运动范围指标中也表现良好。
其他文献
随着城市经济的发展和人们生活质量的提高,城市居民的户外游憩行为日趋多元,对城市户外空间提出更高要求。公园绿地不仅影响着城市的生态环境,更是与市民生活密切相关的户外
土壤重金属污染对人类健康与生活质量带来严重威胁,特别是多种重金属的复合污染,已经成为我国土壤污染防治的研究热点。化学淋洗技术是一种常用的重金属污染土壤修复技术,其
目的:建立靶向HIV-1启动子的药物筛选系统。方法:将HIV-1启动子核心序列克隆入荧光素酶报告基因载体pGL4.17中,构建重组质粒pGL4.17-HIV-1P并转染H9细胞;分别用杜仲、黄芩、苦
《孟子》从十二种意义上使用“心”的概念。《孟子》伦理之心的内容有三:“心”是性善论的理由。“心”是确定人格的根据,“心”是道德修养的途径。孟子的伦理之心属于中国的“
针对辽西北地区的生态现状及辽西北地区所担负的生态责任,采用理论分析与数据论证相结合的研究方法,从理论和现实两个方面分析了在突破辽西北战略中坚持生态优先发展的必要性
目的:观察中国猕猴的CD4+CD25+调节性T细胞(Tregs)对Vγ2Vδ2T细胞体外增殖的影响。方法:取3只正常的无潜伏感染的中国猕猴和6只3个月内人工感染过卡介苗的中国猕猴,分离9只动物外
近些年来,我国不断对教育事业进行深化改革,在新课改的高标准要求下,高职院校为培养身心全面发展的高素质人才,也致力于学校内部教育形式的改革创新,以往改革的内容均是以专
在过去的十年中,中国大力建设特高压输电线路,电网配套设备的市场不断增大。但是,随着国内竞争者的不断进入,在如何确保产品质量的前提下,使S公司的产品售价具有足够的市场竞
目的:探讨分泌型磷脂酶A2(sPLA2)-Ⅱa及胞浆型磷脂酶A2(cPLA2)蛋白的表达与乳腺浸润性导管癌发生发展及浸润、转移的关系。方法:应用免疫组织化学SP法检测57例乳腺浸润性导管癌组织
近十几年来,航天对地观测技术的快速发展使得空间卫星系统的光学观测指标越来越高,光学载荷对星载活动部件正常工作带来的微振动环境越来越敏感。音圈电机作为卫星平台隔振器的核心执行器,其出力精度直接影响着整个卫星平台的隔振性能。在音圈电机的位置、速度、电流环三环中,电流环的电流精度直接与电机的出力精度相关,同时,电流环作为三环控制的最内环,其品质的好坏决定了整个控制系统的性能指标。因此,高精度的电流环控制