半Markov控制过程在折扣代价准则下的性能分析及优化算法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:onlylisong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文基于性能势理论分析了具有Erlang服务分布的排队系统的稳态性能灵敏度问题,给出一种基于其嵌入Markov链来计算势能及性能导数的算法,并用通信网络中的一个实例进行仿真来表明该算法的应用。本文在Markov控制过程相关内容的基础上,研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平折扣代价准则的性能优化算法。文章从样本轨道的角度定义SMCP的α-势,并基于等价Markov过程的最优性方程,给出了求解最优策略的两种迭代算法,并在随后证明了这两种算法的收敛性。最后给出了一个数值的例子以表明算法的应用。  
其他文献
图像分割是数字图像处理中一项基本且关键的技术,分割结果的优劣将会直接影响到图像处理后续进行,在图像分割算法研究过程中,都要考虑到图像中噪声的影响,同时还要注意分割的
传统的抄表系统对用户用电量的统计采用的是人工抄表法,存在很多弊端,不仅要花费大量人力和财力,而且容易引起供电管理部门和用户的冲突。为了解决这些问题,市面上涌现出了各种各
摩崖石刻是传承人类文明历史的重要载体之一,如今面临着腐蚀损毁的困境,拓片一直是保存石刻原貌的唯一方法,但人工拓片严重损害石刻本体,因此研究基于图像的非接触远距离石刻
随着钢铁行业的不断发展,竖炉球团已成为高炉炉料生产的重要工艺。但由于客户对球团的品质和产量要求不断提高,传统的竖炉球团生产控制已不能适应现代技术高速发展的今天,因
让机器能够理解人类所讲语言的内容,这是人类一直努力追求实现的一个梦想。随着隐马尔可夫模型(HMM)的应用,计算机已可以很好地识别安静环境中的语音。但是,一旦出现噪音识别率
可穿戴计算机(Wearable Computer)是一类微型或超微型、可穿戴、人机“最佳结合与协同”的新概念微型个人移动计算系统,是计算“以人为本,人机合一”这一理念的必然产物。可
经过多年的研究,到目前为止,世界上己形成三大数字电视技术标准体系,即美国的ATSC(AdvancedTelevisionSystemsCommittee)、欧洲的DVB(DigitalVideoBroadcasting)、日本的ISDB(In
本文首先概述了国内外冗余研究的重点方向和实现方式。然后概要介绍了现场控制站冗余的选题背景和研究内容,以及作者所做的主要工作。 通过分析比较AUTO-2000DCS的现场控
全球定位系统(GPS)和惯性导航系统(INS)组合导航系统,是目前广泛应用的无人机导航系统。但GPS存在易受外界干扰的缺点,在GPS/INS组合导航系统中,一旦GPS失效,INS将难以长时间
本文以开发自动电话语音转接系统为背景,阐述了在其开发过程中遇到的一些技术问题,在系统构建,电话语音库的建立,语言模型生成等方面进行了研究。该系统以非特定人,特定内容孤立词