Q学习算法相关论文
针对能源互联园区中各主体利益诉求不同以至于难以协调调度的问题,提出了基于多智能体Q学习算法的能源互联园区协调调度方法。首先,......
柔性作业车间调度问题作为一个众所周知的非确定性多项式问题,是生产制造和流程规划环节最关键的问题之一,本文研究柔性作业车间调......
我国正处于人口加速老龄化阶段,数量庞大且逐年递增的失能人士对家庭和社会的护理能力提出了严峻的考验。本课题以减轻失能人士身......
机器博弈作为人工智能的重要分支受到越来越多学者的关注与重视,作为一种流行的扑克竞技游戏,德州扑克一直是机器博弈研究领域的热......
空间大型薄膜天线结构由于质量轻、收纳比大、易于展开等优点,已成为近年来国内外空间天线结构的研究热点之一。为掌握膜面预应力......
随着社会不断发展,城市化不断推进,越来越多的通讯基站,输电线高塔,气象观测站,新能源(光伏,风能)发电设施等基础设施被建立,相关的......
云环境下,数据中心规模不断扩中,新技术的引入不断的提升了资源的弹性,满足更多的高性能计算需求,但也使得云数据中心的结构愈加复......
近些年来,随着城市化进程的不断推进,城市规模不断扩大,越来越多的高层及超高层建筑拔地而起,建筑占地面积快速扩增、平面形态各异......
对抗是现实中十分常见的问题,小到游戏,大到战争处处都有对抗的影子。智能体攻防对抗是一种典型的对抗问题,其对抗主体由若干防守......
超短期光伏功率预测对光伏并网系统的安全运行有着重要意义.针对传统单一预测模型在进行光伏功率预测时受到功率随机波动性的影响......
牵引能耗是列车能耗的主要组成部分,针对城轨列车节能运行的问题,将列车运行状态离散化,以列车对速度控制作为动作空间,时间和能耗......
随着固定翼无人机的广泛应用,自主飞行任务越来越复杂和多样化,现存的导航控制算法多适应于二维平面的导航控制,较难满足复杂飞行......
本文将超轻度混合动力汽车作为研究对象,以提高整车燃油经济性和维持电池能量全局平衡为目的,基于强化学习方法,研究了混合动力系......
近年来,由于智能手机、平板电脑等智能设备的快速普及,推动了移动宽带数据服务需求的显著增长,所以像LTE-A和异构网络等技术先后被......
学位
随着网络通信的飞速发展,带宽资源越来越匮乏,如何高效率地利用网络容量资源成为网络通信研究的热点。在网络组播通信中,线性网络......
移动机器人在动态环境和未知静态环境中缺乏环境相关的先验知识,这就要求其具有较强的灵活性与适应性来应对各种状况。所以,针对静......
近年来,由于传统能源的日益枯竭和生态环境的破坏,可再生能源发电技术以及新能源电动汽车得到了迅速的发展,新能源电动汽车使能源......
电子商务充分利用互联网的优势,消除了企业与企业、消费者与企业之间的地域限制,这给企业创造了无限的商机,给消费者带来了更多的......
合作型多智能体决策技术研究给定的一组智能体如何协调彼此的动作,与环境进行交互,共同完成一个长远的目标。合作型多智能体决策技术......
如何提高基于内容的图像检索(Content-based Image Retrieval)系统的检索结果,这一直是基于内容图像检索的关键问题和最终目的。为......
强化学习是一种无监督的机器学习技术,能够利用不确定的环境奖赏发现最优的行为序列,实现动态环境下的在线学习,因此被广泛用于Age......
目前,在MMOG(Massively Multiplayer Online Games)中应用的人工智能技术比较简单,强化学习算法可以实现更加复杂的游戏智能。由于......
多Agent协作问题是RoboCup2D中研究的热点问题。RoboCup仿真2D中,协作问题解决的好坏直接关乎比赛效果。针对仿真2D中的实际问题,......
无线传感器网络(Wireless Sensor Network, WSN)中的关键问题就是传感器节点能量的有限性,节能高效地使用节点能量是WSN面临的一大......
学位
带球技术作为球员的基本个人技能之一,是RoboCup2D比赛研究的一个重点问题。球员带球动作设计的细致性和准确性以及带球路径选择的......
情绪在人们的日常学习工作中发挥着重要作用,并且人类具有的情感能力是人类与当前智能机器的最大不同之处之一。不断完善的认知心理......
近几年来,人工情感技术得到了很大程度的发展,取得了许多研究成果,但距离人工情感进入寻常百姓家还有很长的路要走。本文立足于人......
经济全球化使得全球之间的联系越来越紧密,贸易往来越来越频繁。信息技术的高速发展,加速了全球化的进程。集装箱的优势和便利条件......
学位
针对云计算领域的资源调度这一问题,国内外学者提出了多种云资源调度模型对其进行求解,但是在实际应用过程中会存在不确定性,因此......
随着技术的发展与社会的进步,产品的耐用性与企业更新换代速度的加快成为了一种矛盾,越来越多的企业开始开展以旧换新活动来解决这......
面对互联网络应用新的需求不断出现,网络体系结构表现出极为的脆弱和不足,SDN网络架构就是在这样的背景下应运而生,旨在改变现有网......
无人机具有飞行时间长、机动性能好的显著优势,特别适用于精确侦查打击、大过载、高速度飞行等实际作战需求。无人机的航路规划和......
首先,分析了Q学习算法在采摘机械手路径规划问题中的应用,介绍了云平台的工作模式,以利用其对路径规划进行计算;然后,设计了农业采......
针对无人机影像目标跟踪过程中常出现的目标方向变化、目标遮挡变化、样本多样性不足等问题,提出了一种基于形态自适应网络的无人......
【摘 要】提出基于Q学习算法的移动机器人避障控制策略,能使移动机器人在不确定环境中顺利躲避障碍物,以最佳路径到达最终目标。将BP......
针对传统输电网规划中对光伏出力不确定性处理中存在的问题,提出一种基于学习理论的含光储联合系统的输电网双层规划模型.下层基于......
多智能体协作问题是近年来分布式人工智能领域研究的一个热点。RoboCup作为验证多智能体一个理想平台,被越来越多的学者用来验证协......
无线传感器网络技术作为物联网的关键技术之一,正引领着一次信息技术革命。作为无线传感器网络技术发展的“瓶颈”,节点能量有限一......
随着我国社会的快速发展,随之而来的道路交通安全问题也日益凸显。道路交通事故逐渐成为影响民众安全感的重要因素之一。根据我国......
能耗和延迟是无线传感器网络(WSN)中的介质访问控制(MAC)协议的主要问题,为此在现有时隙ALOHA协议的基础上,提出一种融合Q学习算法......
随着智能交通的发展,自动驾驶、智能车载交互、安全预警等新型车载应用不断涌现,独立车辆依靠自身有限的计算资源难以运行这些种类......
提出一种NashCC-Q学习算法用于解决两交叉口信号灯协调控制问题。根据博弈论概念,相邻两交叉口之间的协调控制问题属于二人非零和......
针对无人机辅助采集无线传感器网络数据时各节点数据产生速率随机和汇聚节点状态不一致的场景,提出基于Q学习的非连续无人机轨迹规......
针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,......
将分布式Q学习算法与Pareto排序法相结合,提出了一种利用强化学习算法解决多目标优化问题的策略。该策略充分利用Q学习语句式的奖赏......