不确定多目标云资源调度问题的强化学习算法

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:havor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对云计算领域的资源调度这一问题,国内外学者提出了多种云资源调度模型对其进行求解,但是在实际应用过程中会存在不确定性,因此为使云资源调度模型其更贴合实际,本文使用模糊理论对任务的执行时间进行模糊化处理,建立了不确定多目标云资源调度模型,为求解模型,研究了强化学习中的多种改进Q学习算法。本文采用三角模糊数对任务的执行时间进行模糊化处理,建立了以同时优化任务的完成时间和虚拟机的运行成本为目标的不确定多目标云资源调度模型,在Q学习算法上引入权重因子和启发式函数,提出了一种基于自动更新权重因子的启发式Q学习算法(WHAQL)。通过实验证明了不确定云资源调度模型与确定云资源调度模型之间的差异性,验证了不确定性对云资源调度的影响。并在算法对比实验中验证了WHAQL算法的寻优能力和收敛速度。针对云资源调度的不确定性,引用了Z-number模糊数对执行时间进行模糊化处理,建立了一种基于Z-number的不确定多目标云资源调度模型。在Q学习算法的基础上,引入资格迹、启发式函数、权重因子以及Boltzmann机制等多种优化策略,提出了基于资格迹的启发式Q学习算法(HAQL(?))。通过对比HAQL(?)与QL、QL(?)和HAQL三种算法的仿真实验,验证了HAQL(?)的寻优能力和收敛速度;验证了资格迹越大,越有助于算法更快地收敛;验证了HAQL(?)算法使系统的负载更加均衡。为了给云资源调度问题提供一个算法仿真、对比以及测试的平台,使用开源的Swing框架设计了一个云资源调度算法仿真平台,该平台提供了一种简单的操作界面,通过简单便捷的操作就可以对比观察到算法与模型之间的差异性。
其他文献
光纤传感器自上世纪七十年代被提出,由于具有抗电磁干扰、结构紧凑、安全稳定、结构多样以及可实现分布式传感等独特优势,一直是人们研究的热点之一。随着光纤传感技术的不断发展和成熟,以及当今信息化社会对传感器件的巨大需求,光纤传感器越来越多地被应用于建筑、机械、医疗、能源、航天航空、环境监测等各个领域。同时,上世纪九十年代提出的飞秒激光微加工技术,由于具有较高的加工精度,可在材料内部进行三维加工的高自由度
学位
学位
电机与减速器主要采用直接连接方式,特殊环境下进行电机更换时,存在一定的人身安全隐患、更换时间长等问题。采用机械臂代替人工进行电机更换成为一种趋势,为此需在电机与减
行人再识别(Person Re-identification,Person Re-ID)是智能视频监控系统的关键环节,它利用行人视觉和运动信息,将单相机视频监控扩展为多相机协同视频分析,从而实现多相机非重叠区域下的行人目标匹配。然而多相机网络提供丰富监控信息的同时,不同相机间还存在视图差异,如何在繁复视频数据中提取有效的行人特征,并克服视图差异进行判别性相似度匹配是行人再识别的主要研究方向。该文则
随着现代社会的发展,行人重识别在智能监控系统、预防犯罪、刑侦取证、机场安保、国防安全、边境管制等安全领域有着广泛应用。在不同场景数据域之间分布不一致的情况下,把在
为了提高频谱利用率和吞吐量,第四代移动通信技术LTE以及正处在实验室研究阶段以多天线技术为核心的5G移动通信技术都采用了非恒包络的线性调制方式。由于非恒包络对线性度这
时间控制加密技术(Timed-Release Encryption,TRE),主要解决“发送一个仅可在指定时间之后解密的消息”的问题。2008年金融危机之后,题为《比特币:一种点对点的电子现金系统
学位
儿童和青少年的骨龄表明了他们的生长发育情况,骨龄评估在医学、体育、司法等领域有着广泛的应用。传统的骨龄评估临床方法是由医生通过肉眼观察左手整手X光片中多块特定骨头