策略搜索相关论文
深度强化学习凭借着强化学习的决策能力和深度学习的感知能力,实现了从输入到输出的端对端的学习方式,对于解决复杂的无人设备控制......
在取得电脑围棋突破的AlphaGo系统中,强化学习起到了重要作用.本报告简要介绍国内外强化学习的研究进展,重点关注强化学习中的状态......
基于质谱数据的蛋白质鉴定已经成为蛋白质组学中的基础技术,而母离子检测是深度解析鸟枪法蛋白质组学质谱数据的第一步,这一步非常基......
针对“在线预决策、实时匹配”的控制方式中,安控策略搜索速度较慢的问题,提出一种基于神经网络的安控策略搜索方法.该方法利用神......
模型化强化学习是深度强化学习领域中的一种有效学习模式,能够缓解强化学习在实际应用中样本利用率低的瓶颈问题.然而,受环境复杂......
由于Internet的不断发展,现有的路由算法为适应不同的网络要求,从一开始的RIP、OSPF、BGP等几种,衍生出很多新的适用于特殊网络的路由......
针对随机探索易于导致梯度估计方差过大的问题,提出一种基于参数探索的期望最大化(Expectationmaximization,EM)策略搜索方法.首先,将策......
随着计算机技术的不断成熟和数据分析技术的不断完善,近年来突出机器深度学习功能的智能算法取得重大突破。其中以卷积神经网络为......
对增强学习中各种策略搜索算法进行了简单介绍,建立了策略梯度方法的理论框架,并且根据这个理论框架的指导,对一些现有的策略梯度......
间歇式能源接入、全国电网互联、在线运行保护与控制需求等多重因素对电网紧急控制策略搜索提出了新的要求。为此提出了一种基于贪......
灵巧手操作是极具挑战的机器人控制任务之一,并且至今仍存在大量问题尚未解决。本文针对机器人灵巧手操作中抓取任务,以实际Baxter......
路径规划能够让机器人在移动过程中高效准确地避开障碍物。在分析常用路径规划算法优缺点的基础上,引出能够在复杂动态环境下进行......
强化学习是一种Agent在与环境交互过程中,通过累计奖赏最大化来寻求最优策略的在线学习方法.由于在不稳定环境中,某一时刻的MDP模......
增强学习(Reinforcement Learning)又称为强化学习或再励学习,是近年来机器学习和人工智能领域研究的热点之一。与监督学习不同,增......
强化学习(Reinforcement Learning)是一种重要的机器学习方法,在人工智能领域有着举足轻重的地位。强化学习算法又分为有模型的强......