深度q学习相关论文
冰蓄冷空调系统利用夜间多余电能蓄冷,白天蓄冰槽辅助制冷机组供冷,减轻了电网供电压力。和普通空调系统相比,冰蓄冷空调系统初始......
工控靶场为开展工业控制系统安全研究提供重要支撑。面向工控靶场关键任务之一的应用软件行为模拟,提出一种软件机器人技术以实现工......
随着社会经济的进步和计算机技术的发展,人工智能技术的推动和变革日新月异。在现今高性能计算与人工智能算法的推动下,多智能体系......
车联网能够全方位提高车辆互联和智能交通运输服务,如道路安全、交通效率和互联网接入等。但是由于车载通信网络的高速动态性,并且......
近年来,随着我国新一轮电力体制改革的启动,国内加快了电力市场试点建设的进程。目前多个试点省份正式启动了现货系统试运行,如广......
我国应急管理体系建设时间尚短,应急管理基础支撑技术发展还比较薄弱,防范化解重大风险、高效应对重特大自然灾害仍然面临巨大的挑......
水面无人艇(Unmanned Surface Vehicle,USV)是一种重要的海上无人智能装备,可以在军事领域和民用领域发挥重要作用,是当今世界大国研......
近年来,随着铁路货运市场的不断发展,全国铁路货车拥有量稳步增加,车辆运营过程中出现的安全问题也随之增多。轴承作为列车上承载......
移动边缘计算是一种新兴的体系结构,通过将云资源(例如存储和计算能力)部署到无线接入网络的边缘来增强移动云计算的能力。这为用户......
针对旋转机械故障诊断中深度神经网络特征学习能力强、决策能力弱的问题,利用卷积神经网络拟合强化学习中的Q函数,通过Q-learning......
针对传统预测算法在商场空调冷负荷预测中存在数据样本不足和预测精度低的问题,提出了一种基于生成对抗网络的深度Q学习的算法预测......
近年来,我国因城市交通拥堵带来的一系列问题日趋严重,智能交通控制技术的发展,有效地解决了部分城市交通问题。区域协调信号控制......
微网作为智能电网的重要组成部分,其内部接入的能源种类逐渐丰富,使得系统运行状态多样,微网规划设计难度增大。为了分析微网容量......
期刊
针对室内无线网络中的能量消耗过大问题,提出了一种基于深度Q学习的家庭基站发射功率分配算法。首先构造深度学习网络(DLN),优化室......
近年来随着移动互联网的发展,视频、语音、文字等多媒体内容的传输需求越来越大,内容分发成为移动互联网的主要需求。命名数据网络......
随着新一代网络技术的不断突破创新,通信技术沿着数字化、网络化、智能化的方向深入发展。加上个人智能终端应用的不断涌现,用户对......
随着微小卫星及其技术的蓬勃发展,结构固定的卫星已经难以满足各国对其提出的多任务执行能力、较强的环境适应性及抗风险等要求,因......
针对深度Q学习中单个Agent对行星齿轮箱进行故障诊断时出现的识别率低问题,利用多个Agent进行策略学习,结合模糊积分对多Agent的决......
实际交通环境规划最优路径的重要问题是无人车智能导航,而无人车全局路径规划研究主要在于模拟环境中算法求解速度的提升,考虑大部......
针对目前建筑信息模型(BIM)消防疏散路径人工绘制的耗时问题,从提高设计效率出发,提出了一种基于深度Q学习(DQN)与A*结合的混合算......
针对传统Q-learning算法在复杂环境下移动机器人路径规划问题中容易产生维数灾难的问题,提出一种改进方法。该方法将深度学习融于Q......
交通路口的信号控制是缓解交通拥堵压力、提高出行效率并减少安全事故的重要手段。交通控制系统是一个复杂的不确定系统,并具有非......
任务调度是决定云计算性能的关键因素,是典型的NP-hard问题。随着用户互联网对服务质量(QoS)要求的日益增长,动态任务调度问题越来......
交通信号控制是缓解交通拥堵、提高出行效率和减少安全事故的重要手段。固定配时方法是交通信号控制系统常用的控制算法,其缺点在......
本文提出了一种预测外汇汇率序列的新方法。使用机器学习算法,尤其是深度Q学习,通过从技术指标中提取信息,发现外汇市场汇率变化的......
近年来,轨道交通在我国综合交通运输体系中发挥着日益重要的骨干作用。伴随着列车运行速度、密度的不断提高以及运行场景、环境的......
为了降低交叉口信号控制的部分可观测马尔科夫特性对深度Q学习性能的影响,引入深度循环Q学习,将全连接网络层改为LSTM层,同时针对......
信任推荐系统是以社交网络为基础的一种重要推荐系统应用,其结合用户之间的信任关系对用户进行项目推荐.但之前的研究一般假定用户......
针对工业应用的抛光设备价格昂贵且对于复杂曲面工件实用性不强的问题,研发一种五自由度混联抛光机器人。首先结合主体机构和控制......
针对视频人脸识别中存在的动态人脸信息捕捉困难和局部人脸特征提取粗糙的问题,提出了一种基于深度Q学习和注意模型结合的视频人脸......
针对传统Q-learning算法在复杂环境下移动机器人路径规划问题中容易产生维数灾难的问题,提出一种改进方法。该方法将深度学习融于Q......
期刊
强化学习中智能体与环境交互的成本较高.针对深度Q学习中经验池样本利用效率的问题,提出基于TD-error自适应校正的主动采样方法.深......
将深度学习算法融入到强化学习的游戏图像处理中是适宜的做法,也使得对图像游戏的研究更加深入。然而运用深度强化学习算法来处理......
风电是一种发展成熟度较高的可再生能源,具有绿色清洁、环境友好的特点。近年来,随着能源、环境及气候问题的日益突出,风电在电力......
由现代强化学习和深度学习相结合形成的深度强化学习方法是目前人工智能领域一个新的研究热点,已经在各种需要感知高维度原始输入......
民航发动机是大型复杂装备,具有可靠性要求高、使用寿命长、维修成本高、维修复杂等特点。合理的安排发动机全寿命历次维修时机和......
目前市场对于抛光产品表面的质量要求越来越高,特别是珠三角地区的中小型制造企业。传统的人手抛光方式对健康危害较大,导致抛光行......
近年来,不断发展的交通信号控制技术有效地解决了部分的城市交通拥堵问题。随着出行模式、驾驶行为以及道路基础设施等方面的变革......
在传统的路径规划方法中,行星车的所有行为都是地面人员事先定义好的。但行星车的作业环境不是完全已知的,这就需要行星车具备一定......
现有的强化学习算法在平衡类游戏中存在过拟合与参数设置不当等问题。针对这些问题,强化学习算法应用到平衡类游戏中,不仅可以改善......
服务机器人是机器人行业重要的一个研究方向。近几年,面向教育、医疗、家居等行业的服务机器人在市场上涌现,但是当前服务机器人行......
将机械臂避障路径规划问题置于强化学习的框架当中,采用深度Q学习的方法训练策略以规划路径,使得机械臂能够在空间中存在障碍物的......
针对基于生成对抗网络的Q学习能耗预测算法中,将传统Q学习算法,应用于大状态空间存在收敛速度慢以及非线性条件下能耗预测性能较差......