半马尔可夫决策过程相关硕士博士期刊学术论文

半马尔可夫决策过程相关论文

基于比例风险模型的动态视情维修策略建模与决策优化

预防性维修可以提高可用度,减少维修花费,是保持产品性能和可靠性的重要手段。随着信号分析和处理技术的快速发展,视情维修在航天......

学位

比例风险模型视情维修经济生产量模型动态规划半马尔可夫决策过程

基于半马尔可夫决策过程的风机维修优化研究

当今世界,能源是人类生存和发展的重要基础。其中风能是一种分布广泛的清洁型能源,风力发电也越来越受到人类的关注与重视。与此同......

学位

半马尔可夫决策过程策略迭代 Q学习风力发电机维修决策优化模型

SMDP基于性能势的异步优化算法

随着社会和科技的发展,离散事件动态系统(DEDS)的性能分析和优化应用已经成为控制与系统、管理、计算机等学科交叉领域内的一个前......

学位

半Markov决策过程性能势异步迭代优化仿真平台

折扣和平均准则下SMDP基于性能势的统一强化学习算法

作为一类特殊的随机过程,Markov过程在实际生活中有着广阔的应用领域。Markov决策过程(MDP)和半Markov决策过程(SMDP)都是描述这类......

学位

半Markov决策过程性能势一致化Markov链强化学习神经元动态规划

无线网络中基于马尔可夫决策过程的资源管理研究

随着移动互联网技术和物联网技术的迅速发展,无线通信设备的数量呈爆炸式增长。海量的无线通信设备不仅会产生巨大的能量消耗,同时......

学位

马尔可夫决策过程半马尔可夫决策过程资源管理射频能量收集通信可再生能量收集通信云-雾计算系统时延约束基于模型的规划算法免模型强化学习算法

有限阶段半马尔可夫决策过程

本文主要研究有限阶段半马尔可夫决策过程(简记为SMDPs)。本文考虑有限阶段期望报酬准则，研究可数状态空间，有限行动空间和无界报酬......

学位

半马尔可夫决策过程有限阶段最优策略最优方程

基于S MD P的光柴储独立微网能量控制策略优化

考虑含光伏发电装置、储能装置和柴油发电机组的独立微网系统，以提高微网长期运行经济性为目标，研究微网能量管理优化问题。首先对系......

期刊

微网(微电网) 光伏发电储能半马尔可夫决策过程

基于SMDP环境的自主生成options算法的研究

$options是一种与SMDP模型紧密相关的引入时间抽象的强化学习算法!该算法一个重要且仍待解决的问题是如何能使agent自主找到合适的......

期刊

强化学习马尔可夫决策过程抉择半马尔可夫决策过程子目标

基于策略迭代和遗传算法的SMDP鲁棒控制策略求解

半马尔可夫决策过程（SMDP）描述的一类受控半Markov系统，其模型参数在实际中常常不确定或不可知，可能导致随机过程的性能函数和系统参数......

期刊

半马尔可夫决策过程性能势鲁棒控制遗传算法 semi-Markov decision process performance potential rob

不确定SMDP基于全局优化的鲁棒决策问题

考虑半马尔可夫决策过程(SMDP)在一些系统参数不确定,且性能函数依赖于这些参数时的鲁棒决策问题。这些参数的不确定性不仅导致等......

期刊

半马尔可夫决策过程性能势鲁棒决策全局优化 semi-markov decision processes performance potential r

铁路客运票额预售控制决策模型研究

客票发售是列车能力利用的具体表现,票额出售即为能力占用,预售期购票需求的变化直接影响着列车能力的占用过程。本文在已知基于列......

期刊

铁路客运票额预售控制决策半马尔可夫决策过程最大期望票价收益

基于SMDP模型的Web服务组合优化方法

针对Internet环境的动态性和Web服务的不确定性，文章使用有限状态连续时间半马尔可夫决策过程（Semi—MarkovDecisionProcess，简称SMDP......

期刊

WEB服务组合半马尔可夫决策过程服务质量(QoS) Q学习 Web service composition semi-Markov decision pro

分层增强学习在足球机器人比赛中的应用

足球机器人的研究是一项挑战性的研究领域,为了设计出智能型的球员必须涉及到计算机、人工智能、视觉及机械学等方面的研究。球员......

期刊

增强学习半马尔可夫决策过程足球机器人 Reinforcement learning Semi - Markov decision processes (SM

分层强化学习综述

强化学习(reinforcement learning)是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注。强化学习算法要解......

期刊

人工智能机器学习强化学习分层强化学习深度强化学习马尔可夫决策过程半马尔可夫决策过程维度灾难

基于马尔可夫决策理论的规划问题的研究

近年来,智能体及多智能体规划问题成为人工智能领域新的研究热点,且有着广泛的应用前景。本文针对马尔可夫决策过程及其相关理论展......

学位

多智能体马尔可夫决策过程部分可观察随机博弈半马尔可夫决策过程 Option 机器人足球实时动态规划

车载云计算系统中资源分配的优化方法

随着车联网(IoV)应用服务的发展,提升网络的任务卸载能力成为满足用户服务需求的关键。文中针对动态场景中车辆计算资源共享问题,......

期刊

车载云计算半马尔可夫决策过程忙碌车辆资源分配 vehicular cloud computingsemi-Markov decision processb

基于决策理论的CDMA网络中多类业务的准入控制策略

准入控制是码分多址(CDMA)蜂窝网络中服务质量保证的一个关键技术.该文提出了一个基于半马尔可夫决策过程理论的最优准入控制策略......

期刊

决策理论 CDMA网络准入控制蜂窝网络半马尔可夫决策过程服务质量码分多址 Admission control CDMA cellular netwo

基于半马尔可夫决策过程的风机变速箱最优维修策略研究

针对风机变速箱的劣化特性和维修策略问题,将变速箱的劣化过程看成一个Gamma过程,把维修方式和检测时间间隔作为决策变量,同时又考......

期刊

变速箱半马尔可夫决策过程状态维修策略迭代 Q 学习算法 gearbox semi-Markov decision process condition-ba

Optimization of dynamic sequential test strategy for equipment health management

Testing is the premise and foundation of realizing equipment health management (EHM). To address the problem that the st......

期刊

测试策略健康管理化设备半马尔可夫决策过程马尔可夫过程健康状态退化模型健康状况 equipment health management （EHM）

半Markov决策过程强化学习算法研究

强化学习作为机器学习领域中的一种主要算法,在智能决策和行为认知等领域有着重要作用,也是解决随机序贯决策问题的有效方法。虽然......

学位

半马尔可夫决策过程平均报酬准则性能灵敏度强化学习算法

平均奖赏强化学习算法研究

顺序决策问题常用马尔可夫决策过程（MDP）建模．当决策行为执行从时刻点扩展到连续时间上时，经典的马尔可夫决策过程模型也扩展到半马尔......

期刊

平均奖赏强化学习性能势 G-学习马尔可夫决策过程半马尔可夫决策过程

分层强化学习研究进展

首先介绍了半马尔可夫决策过程、分层与抽象等分层强化学习的理论基础；其次，较全面地比较HAM、options、MAXQ和HEXQ四种典型的学习方......

期刊

分层强化学习半马尔可夫决策过程抽象

服务率不确定的单站点传送带给料加工站系统鲁棒优化控制

研究了服务率不确定情况下的单站点传送带给料加工站（CSPS）系统的鲁棒优化控制问题。在仅知服务率区间的条件下,以CSPS系统的前视距......

期刊

传送带给料加工站半马尔可夫决策过程不确定服务率全局优化鲁棒控制策略

多状态退化系统最优故障维修策略

针对多状态半马尔可夫退化系统,研究了系统发生故障后的维修模型.在系统的退化过程中,有多个不可逆的工作状态和故障状态.系统的所......

期刊

多状态退化系统长期平均成本率半马尔可夫决策过程策略迭代算法最优故障维修策略

看过本文同时还关注