奖励函数相关论文
移动机器人穿越动态密集人群时,由于对环境信息理解不充分,导致机器人导航效率低且泛化能力弱。针对这一问题,提出了一种双重注意深度......
针对现有的路径规划算法效率低的问题,根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度,为......
近些年来,机械臂随着工业化的发展已经逐渐在人们的日常生活中得到广泛应用,但同时对机械臂的工作环境、工作任务等要求也高了不少......
自动驾驶技术一直是人工智能领域研究的热点之一。传统模块化方法受限于驾驶环境的复杂,难以做出系统性设计;基于监督学习的深度神......
随着车辆智能化程度的提高,自动泊车技术逐渐成为研究热点。目前,由于泊车环境恶劣、驾驶员经验不足,导致狭小空间内泊车困难,因此......
针对中小型规模水下无线传感器网络中存在的节点能量消耗不均衡、网络生命周期较短的问题,提出一种基于强化学习(RL)与消息反馈机......
关于移动机器人的研究始终绕不开导航控制,目前有很多优秀的算法应用于机器人导航,取得了众多成果,但这些算法大多依赖环境地图或......
中国高速公路里程已经突破14万公里,稳居世界第一,但与此同时交通事故率也高居不下。合流区的交通环境复杂,易出事故,是高速公路车......
针对蒸汽发生器精确建模困难和低工况下控制性能差的问题,本文提出了一种基于深度强化学习优化的智能分层(IH)控制器.使用串级PI控......
自动驾驶是车辆工程技术发展的重大变革,其在有效提高道路安全性的同时,对于缓解交通拥堵、减少环境污染具有重要作用。从自动驾驶......
近年来,随着深度学习算法的不断更新改进与计算机硬件设备计算能力的提高,聊天机器人的研究也取得了很大的进展和突破。生成式的聊......
核物理技术推动了当代国防和能源技术的快速发展,但核废料的不当处理导致放射性元素泄露而造成环境污染、癌症诱发等问题。质子直......
随着移动互联网的快速发展和智能终端技术的不断更新,无线移动用户的数量在过去几年中不断增加。预计这种趋势将在未来几年内会一......
针对空间漂浮基座机械臂抓捕非合作目标控制所基于的多体系统动力学模型难以精确建立的问题,基于深度强化学习算法的控制策略,提出......
摘 要: 为解决软件定义网络(SDN)中的流量工程(TE)问题,提出了一种深度强化学习路由(DRL-Routing)算法.该算法使用较全面的网络信息来表示......
听音乐有助于纾解人们的压力,现已成为大众娱乐的一种重要方式.互联网的发展使人们听音乐变得方便,但同时也使得“信息过载”的问......
针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应......
持续集成环境下的测试存在测试用例集变化大、测试时间有限和快速反馈等需求,传统的测试优化方法难以适用.强化学习是机器学习的一......
针对海洋平台管路系统设计周期长、效率低等问题,以平台管路优化布置为研究对象,以管段长度、弯头数和架设高度为控制目标建立数学......
主要解决网格环境下动态资源的管理问题.首次提出了资源信用的概念,通过资源信用描述资源的可靠性和动态性.初步定义了影响网格资......
自适应巡航控制(Adaptive Cruise Control System,ACC,下同)又称主动巡航控制。作为一种高级驾驶辅助功能,自适应巡航控制系统通过......
<正>一般来说,让机器人在现实世界中自主行动是一件很困难的事情。即使具有昂贵的机器人和世界一流的研究人员,机器人仍然难以在复......
传统图像配准方法中,图像特征的表示和相似性测度的选择易受到人为因素的影响,不能准确地表征图像特征和配准图像的相似度,从而对......
<正>众所周知,强化学习(RL)是一种强大的技术,它能够解决诸如移动(locomotion)、Atari游戏、赛车游戏以及机器人操作等复杂的任务,......
目前汽车行业的发展重心正逐步由传统车辆向智能车辆转移,随之带来的是智能驾驶技术的迅速发展。自动泊车系统是智能驾驶技术的研......