马尔可夫决策过程(MDP) 相关硕士博士期刊学术论文

马尔可夫决策过程(MDP)相关论文

基于强化学习的写字楼动态电力价格策略

针对城市商业区写字楼的微电网能源管理系统,如何有效地进行能量协同调度具有重要的理论价值与应用价值.提出了基于强化学习的写字......

期刊

强化学习能量调度电力价格马尔可夫决策过程(MDP) 需求响应

基于聚类算法的医院门诊预约调度模型研究

目的:建立基于聚类算法的医院门诊预约调度模型,使门诊患者获得不同的优先顺序,缩短其候诊时间.方法:采用K均值聚类、聚集层次聚类......

期刊

K均值聚类凝聚层次聚类马尔可夫决策过程(MDP) 门诊调度

面向RFID动态帧时隙ALOHA协议的帧长优化

近年来,国家电网积极推动泛在电力物联网的建设,以实现电力系统的万物互联与优化管理。其中,射频识别技术(RFID)作为泛在电力物联......

期刊

射频识别(RFID) 动态帧时隙ALOHA 帧长优化马尔可夫决策过程(MDP) Q-LEARNING

基于事件驱动的卫星通信系统建模与传输功率优化控制

卫星通信是指在地球上的多个地球站之间利用在空中的人造通信卫星作为中继站而进行的无线电通信.卫星通信系统是由通信卫星和地球......

学位

卫星通信最优控制传输功率(TPR) 马尔可夫决策过程(MDP)

一种结合Tile Coding的平均奖赏强化学习算法

平均奖赏强化学习是强化学习中的一类重要的非折扣最优性框架,目前大多工作都主要是在离散域进行.本文尝试将平均奖赏强化学习算法......

期刊

强化学习马尔可夫决策过程(MDP) R-学习 G-学习平均奖赏

随机QoS感知的可靠Web服务组合

在面向服务的环境下，单个Web服务往往不能满足用户的要求，这时就需将已有的单个Web服务进行组合，以便产生满足用户需求的、增值的组合......

期刊

WEB服务组合马尔可夫决策过程(MDP) Qos随机性 WEB服务可靠组合 Web service composition Markov decision

基于时序差分学习的充电站有序充电方法

电动汽车有序充电是智能用电领域的重要议题。传统的模型驱动方法需对充电行为建模,但受相关参数的强随机性等影响,相关模型不能完......

期刊

电动汽车有序充电无模型强化学习数据驱动方法马尔可夫决策过程(MDP) electric vehicle coordinated charging mod

基于随机动态规划的有限库存ATO系统优化控制

本文研究n维组件单一产品，有限库存的ATO系统。通过建立马尔可夫决策过程模型（MDP），构造优化算法，研究组件生产与库存的最优控制策略。......

期刊

按订单装配(ATO) 优化控制马尔可夫决策过程(MDP) assemble-to-o-rder（ATO） optimal control markov d

基于马尔可夫决策过程的电动汽车充电行为分析

针对电动汽车充电行为不确定性问题,建立了基于出行链理论的电动汽车出行及电池电量变化模型,提出了引入马尔可夫决策过程(Markov ......

期刊

电动汽车出行链马尔可夫决策过程(MDP) 用户充电行为

爱尔朗型按订单装配系统最优生产——库存控制策略研究

本文研究具有复杂装配结构的爱尔朗型按订单装配(ATO)系统的组件生产与库存优化控制问题。系统涉及多种组件,一个最终产品和多类客......

期刊

按订单装配(ATO) 优化控制马尔可夫决策过程(MDP)

基于HMDP的无人机三维路径规划

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清......

期刊

无人机(UAV) 路径规划马尔可夫决策过程(MDP) 分层马尔可夫决策过程(HMDP) 仿真

基于QoE的室内VLC-RF异构网络垂直切换方案

第四代(4G)及未来通信系统包含多种无线接入标准,覆盖范围、网络可用性和用户体验质量(QoE)会随着用户设备(UE)的移动和速度而快速......

学位

体验质量(QoE) 可见光通信(VLC) 马尔可夫决策过程(MDP) 垂直切换(VHO)方案模糊逻辑(QFL)

需求随机的库存—路径问题研究

近年来,人们已经认识到供应链管理(Supply Chain Management, SCM)包括采购、存贮、运输、原材料配送的重要性,它已成为企业获得竞......

学位

库存-路线问题(IRP) 随机需求供应商管理库存(VMI) 马尔可夫决策过程(MDP)

基于Q-Learning算法和神经网络的飞艇控制

针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的......

期刊

飞艇马尔可夫决策过程(MDP) 机器学习 Q-Learning 小脑模型关节控制器(CMAC)

基于多Agent系统的动态任务分配研究

动态任务分配就是将合适的任务实时地分配给合适的成员,以充分利用系统的资源,提高任务的完成绩效。它通常包含再分配型和新任务型......

学位

多Agent系统(MAS) 任务分解任务分配马尔可夫决策过程(MDP) 合同网(CNP)

看过本文同时还关注