基于深度强化学习的软件定义卫星姿态控制算法

被引量 : 0次 | 上传用户:sanyueyusi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度强化学习(Deep Reinforcement Learning,DRL)技术作为一种新型的基于机器学习的控制算法,在机器人和无人机等智能控制领域展现出了优异的性能,而卫星姿态控制领域仍然在广泛使用传统的PID控制算法。随着卫星的小型化、智能化以至软件定义卫星的出现,传统控制方法越来越难以满足姿态控制系统对适应性、自主性、鲁棒性的需求。因此对基于深度强化学习的姿态控制算法进行了研究,该算法使用基于模型的算法,比非基于模型的算法拥有更快的收敛速度。和传统控制策略相比,该算法无需对卫星的物理参数和轨道参数等先验知识,具有较强的适应能力和自主控制能力,可以满足软件定义卫星适应不同硬件环境,进行快速研发和部署的需求。(仿真实验表明该方法在经过一段时间的学习和探索之后,能够达到系统要求的控制目标。)
其他文献
介绍了日本准天顶卫星系统的基本特征,包括其为达到高完好性而设计的高倾斜椭圆轨道。详细说明了该系统的导航信号设计,包括与GPS兼容的信号及新设计的两种信号结构。
分析现代城市物流采购与配送的特点和地理信息技术的优势,提出基于GIS技术的物流管理信息系统解决方案。采用GIS组件技术,建立基于ArcEngine的物流采购与配送管理信息系统,该
在我国的经济发展过程中,无论是大企业,还是中小企业,都做出了应有的贡献。由此可知,确保各企业能够健康稳定的发展是至关重要的。全面预算管理作为现代管理模式的重要组成部
当前电动汽车相关技术飞速发展,电池荷电状态(State of Charge,SOC)估算作为电动汽车动力电池管理系统的重要组成部分,受到国内外科研人员的广泛关注。为解决现有电池SOC估算结
辣子草(Galinsoga parviflora Cav.)原产南美洲,1915年在我国云南和四川等地发现,是一种危害较严重的外来入侵种。研究其在逆境条件下的生理适应机制和化感作用对于有效预警
近年来,稀土掺杂上转换纳米材料用作药物载体实现靶向诊断和治疗在生物医学领域引起了人们的广泛关注。本论文介绍一种基于新型药物大配体铂共轭稀土上转换纳米晶NaGdF4:Yb3+
古人对羊有好感,一是因为羊的孱弱,给人以温顺善良、正直无私的印象;二是因为羊肉是美食。
伴随着社会经济的快速发展,企业之间的竞争日趋激烈。企业为了提高自身的竞争能力就必须加强自身的管理能力。预算管理是现代企业管理工作中的重要组成部分,对企业组织结构整
利用PEST生态分析法,从政治法律环境、经济环境、社会文化环境以及技术环境四个方面,对国内尤其是上海公共图书馆的生态环境进行分析,并以上海图书馆"十三五"发展战略规划编