确定性策略相关论文
末制导律设计是拦截系统中的关键技术,常用的比例制导律及其变型在目标大机动时性能下降,且受到导航比的影响.提出基于DDPG算法的......
深度强化学习是机器学习领域中一个新的研究热点。它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并通过端对......
制导律是一种为无人飞行器规划最优飞行路径的算法,常被应用与无人机和导弹等飞行器的控制系统中。现阶段的制导律多数基于比例制......
苏珊·桑塔格的《反对阐释》一文使她成为大众视野里代表先锋文学的偶像,她的作品也深刻体现了她的先锋理论。本文尝试通过解读她......
探讨一类占线订单加工问题,具体分析当订单交货时间具有一定上限约束时的不可中断和可中断两种模型。对于不可中断模型,证明先到先服......
无人驾驶的决策控制是无人驾驶技术的核心,它需要根据道路场景的感知信息做出安全、合理的决策,特别是对各种场景下不可控突发状况......
本文讨论了[1]中所定义的正规一般决策模型DM的最优策略的结构。证明了在假设C下,任一策略π为最优策略的充要条件是:其几乎处处可......
现代企业制定生产计划的主要依据是客户订单,如何对订单进行合理排序从而获得更大收益成为企业在竞争中获胜的关键。论文针对到达......
商家在策划优惠卡发行时需要严密论证发行价格和折扣率等因素对消费者消费行为的影响.利用在线算法和竞争分析理论,研究了消费者对......