基于深度强化学习的海上网络资源分配研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:chinajolly66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自“智慧海事”提出以来,海事信息管理系统向着自动化与智能化方向飞速发展。然而,为海洋用户提供可靠、高质量的网络服务质量(Qualityof Service,QoS)却成为了限制海上通信发展的瓶颈。在大量异构网络共存的海洋环境中,传统路由算法对于QoS的优化目标是单一的,并且需要反复建立模型、调整参数,不能满足大多数业务的QoS和在线信息获取需求。在处理多目标QoS优化问题(即时延,丢包率,能耗等),由于问题的高复杂度使传统方法无法有效解决。因此,本文在多目标QoS约束下,针对海上无线网络的选路优化问题和资源高效分配问题进行相关研究:(1)针对海上通信网络的异构性,本文提出了一种软件定义的海事通信网络架构。该架构集成空、天、地、海的网络部署,并运用软件定义网络(Software Defined Network,SDN)打破了开放系统互联(Open System Interconnection,OSI)模型的垂直结构,实现了控制与转发的分离,简化了网络的运维管理过程。其次,通过其统一的Openflow标准实现数据集中式调度,解决了海洋异构网络中的通信问题,从而实现高效传输。(2)针对所提出的SDN架构中选路优化问题,本文提出了一种基于马尔可夫决策过程(Markov Decision Processes,MDPs)的最优链路选择方案。该方案综合考虑海上通信环境中的信道状态、节点的缓存状态与能耗问题,并建立系统评价模型评价节点、链路质量。该方案将数据传输过程建模为MDPs,SDN控制器通过Agent自主探索系统环境,对外部环境状态的转移信息进行学习并获取最优策略。当Agent获取经验后,系统进行动态选路优化,做出最优链路选择方案。(3)为在实现快速分配的同时,保障业务信息在多节点间的QoS,即保障网络的时延、总吞吐量、链路可靠性等性能指标,本文提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的多目标QoS优化机制。该机制引用DRL算法于SDN路由决策元层,依靠前期所提出的最优链路方案离线获得最优路径,将相应的节点集输入到路径数据库中,并利用库中的节点集作为样本标签来训练DRL模型。在训练完成最佳模型后,面对新的连接请求时,仅通过与模型内部已知权重参数的简单计算来获取最优路径,大大提升了选路效率,从而实现网络资源的快速分配。(4)通过仿真实验对所提方案和机制在拟定的复杂海上通信环境下的可行性与优越性进行验证。与现有方法进行横向对比分析表明,所提方案可有效做出最优决策,所提机制大大提高了数据传输时的选路效率,并保障了吞吐量、丢包率、能耗等性能指标。
其他文献
集物联网、云计算等新一代信息技术于一身的智慧校园在学校有很多应用,对日常的教学管理起到了积极的促进作用,以物联网为基础的智慧校园以各种应用服务系统为载体,将教学、
新冠肺炎疫情对每个人的心理都造成了不同程度的影响,在疫情的不同阶段高校面临的心理健康教育的任务不同。进入后疫情时期,高校心理健康教育工作呈现新的特点,面临新的挑战
党的十八大以来,以习近平同志为核心的党中央高度重视文化文艺事业,习近平总书记在文艺工作座谈会、中国文联十大、全国宣传思想工作会议、全国政协十三届二次会议上,多次对
为了创造竞争优势,企业通常会与其同行保持差异性。然而,在企业社会责任(CSR)实践中,很多企业都会与同行保持一定程度的相似性。事实上,企业面临着同构和异质的双重压力。一方面,为了获得行为的合法性,企业需要与同行保持一致;而另一方面,为了建立竞争优势,企业又需要与同行保持差异。在CSR这一具体情境中,企业动态平衡同构和异质双重压力的决策依据是什么?具体而言,在进行CSR活动时,企业是应该采取感知高相
八股文写作其实也是话语修辞行为,士子——表达者希望实现自己的表达预期。只有当表述者——士子的经验系统与接受者——考官的经验系统对接时.修辞话语的信息通道才是畅通的。
瓦尔特·格罗皮乌斯从未去过上海,但是第二次世界大战后,他接到了上海一所大学的新校区设计委托。格罗皮乌斯在1946年创办了协和建筑师事务所,这个大学即为新公司的第一个项
通过快速凝固技术制备合金材料,可以大幅度细化合金组织,其技术的冷却速度.本文通过对流换热原理对超音速气体雾化高硅铝合金粉末的冷却速度进行了理论计算,结果表明其冷却速
1.智力题(1)甲取的是1和9;乙取的是4和5;丙取的是3和8;丁取的是2和6;剩下的一张牌是7。(2)在阳光下,黑布吸收的热量比其他布都多,即使眼睛看不见,也能很快分辨哪块是黑布。
旨在探讨微生态制剂对断奶仔猪的生长性能、免疫指标的影响。选择35日龄断奶仔猪共36头,平均分成Ⅰ组、Ⅱ组及Ⅲ组3组,每组2个重复,每个重复6头。Ⅰ组饲喂全价日粮+2‰复合微
目的研究2~6岁儿童骨密度值与体格发育之间的相关性,探讨体格发育对儿童骨密度的影响。方法选取2018年2月至2018年9月在四川省妇幼保健院儿保门诊体检的1403名年龄为2-6岁儿