马尔可夫决策过程(MDP)相关论文
针对城市商业区写字楼的微电网能源管理系统,如何有效地进行能量协同调度具有重要的理论价值与应用价值.提出了基于强化学习的写字......
目的:建立基于聚类算法的医院门诊预约调度模型,使门诊患者获得不同的优先顺序,缩短其候诊时间.方法:采用K均值聚类、聚集层次聚类......
近年来,国家电网积极推动泛在电力物联网的建设,以实现电力系统的万物互联与优化管理。其中,射频识别技术(RFID)作为泛在电力物联......
卫星通信是指在地球上的多个地球站之间利用在空中的人造通信卫星作为中继站而进行的无线电通信.卫星通信系统是由通信卫星和地球......
平均奖赏强化学习是强化学习中的一类重要的非折扣最优性框架,目前大多工作都主要是在离散域进行.本文尝试将平均奖赏强化学习算法......
在面向服务的环境下,单个Web服务往往不能满足用户的要求,这时就需将已有的单个Web服务进行组合,以便产生满足用户需求的、增值的组合......
电动汽车有序充电是智能用电领域的重要议题。传统的模型驱动方法需对充电行为建模,但受相关参数的强随机性等影响,相关模型不能完......
本文研究n维组件单一产品,有限库存的ATO系统。通过建立马尔可夫决策过程模型(MDP),构造优化算法,研究组件生产与库存的最优控制策略。......
针对电动汽车充电行为不确定性问题,建立了基于出行链理论的电动汽车出行及电池电量变化模型,提出了引入马尔可夫决策过程(Markov ......
本文研究具有复杂装配结构的爱尔朗型按订单装配(ATO)系统的组件生产与库存优化控制问题。系统涉及多种组件,一个最终产品和多类客......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
第四代(4G)及未来通信系统包含多种无线接入标准,覆盖范围、网络可用性和用户体验质量(QoE)会随着用户设备(UE)的移动和速度而快速......
近年来,人们已经认识到供应链管理(Supply Chain Management, SCM)包括采购、存贮、运输、原材料配送的重要性,它已成为企业获得竞......
针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的......
动态任务分配就是将合适的任务实时地分配给合适的成员,以充分利用系统的资源,提高任务的完成绩效。它通常包含再分配型和新任务型......