基于机器学习的视频传输和资源调度技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:quake_bj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着智能终端和无线互联网技术的蓬勃发展,移动视频流量将占据全球移动数据流量的绝大部分,用户对流媒体业务体验质量(Quality of Experience,Qo E)的要求也越来越高,而高Qo E的视频传输将消耗更多的带宽资源,使得无线带宽资源更加稀缺。随着边缘计算的兴起,将带宽资源分配算法和自适应比特率(Adaptive Bitrate,ABR)算法联合考虑,从全局的角度优化无线视频传输系统中多用户的总体Qo E变得可行。然而无线带宽资源分配和自适应比特率的联合决策算法仍然面临着许多挑战。实际场景中存在大量用户,联合算法需要对每个用户进行资源分配和ABR决策,将使得决策空间非常大。该联合决策问题是一个复杂的非凸优化问题,难以采用最优化方法寻找最优解。此外,基于固定策略的传统方法依赖于对环境的建模和先验知识,难以扩展到不同的网络环境中。因此,本文以无线视频传输系统中多用户的总体Qo E优化为研究点,以实现高性能和高通用性的带宽资源分配和ABR的联合决策算法为切入点,提出了一个基于机器学习的通用算法框架实现带宽资源分配和ABR的联合决策。具体来说,本文提出了基于单智能体Actor-Critic分级深度强化学习的服务质量(Quality of Service,Qo S)控制和ABR的联合算法(QOS&ABR)以及基于多智能体Actor-Critic分级深度强化学习的带宽资源分配和ABR的联合算法(Bandwidth Allocation and ABR,MAC-BA&ABR)。本文的主要创新点如下:1.由于带宽资源分配和自适应比特率决策的异步性,本文首先提出了基于Actor-Critic单智能体深度强化学习的分级联合决策算法,即QOS&ABR算法。该分级决策算法由带宽分配决策网络和比特率决策网络组成,各级决策网络均由Actor-Critic网络构成。Actor网络利用在线环境中能够获取的信息如信道质量,客户端播放器状态等进行决策,Critic网络对Actor网络的决策进行评价,通过环境反馈的Qo E作为奖励实现策略的在线更新,而不需要环境模型的先验知识。实验结果证明,所提算法相比传统方法在不同Qo E标准上均取得了明显的性能提升。此外,该算法具有良好的扩展性,只需对网络结构和奖励设计进行微调和一定的训练,就可以适用于不同波动程度的无线信道和Qo E标准的视频流传输场景。2.为了适应用户数较多的场景,本文将基于传统Actor-Critic结构的单智能体带宽资源分配网络改进成基于多智能体Actor-Critic的形式,提出了MAC-BA&ABR算法。MAC-BA&ABR中的各Actor网络只需要观察用户的局部环境状态对带宽资源分配进行决策,而通过一个Critic网络观察全局环境信息,对各Actor网络的决策做出全局评价,保证了资源分配在优化总体Qo E层面上的公平性。多智能体的设计减少了用户数目变化带来的网络参数增加和结构变化,进一步提高了算法的性能和通用性。3.为了提高联合决策算法对信道质量波动剧烈环境的适应性和前瞻性,本文采用长短期记忆网络(Long Short-Term Memory,LSTM)对信道质量进行预测。LSTM通过学习信道质量的历史值,可以较准确地预测信道质量的变化。实验结果证明,结合LSTM的联合决策算法比未结合LSTM的算法在优化多用户总体Qo E上的性能更优。
其他文献
近年来,新经济公司的崛起推动了双重股权结构IPO的又一次热潮。为实现创新型国家发展战略,推动新经济发展,我国允许双重股权架构公司在科创板上市。双重股权结构公司中存在着管理层固化与内部人控制损害外部投资者利益的问题,因而协调创始股东与外部投资者的利益关系重要。相较于其他平衡规则,“日落条款”能够有效约束控制股东行为,能够构建适当的控制权移转机制。为充分发挥“日落条款”的功能,我国应当修改现有规则,确
碰撞振动系统混沌动力学的研究是非光滑系统动力学研究的热点问题之一.Melnikov方法是研究混沌运动最常用的解析方法之一.本文针对三种典型的碰撞振动系统,利用Melnikov方法获得了系统出现Smale马蹄混沌的解析结果,并用数值方法对解析结果进行了验证.第1章绪论.本章概述了碰撞振动系统的研究背景、研究意义和研究现状.第2章有界噪声激励下单势阱碰撞振动系统的混沌运动.本章基于随机Melnikov
自1979年我国第一家城市信用合作社成立至今,城市商业银行也走过了将近四十年的发展历程。当前,国际经济金融形势复杂多变,逆全球化思潮、贸易保护主义暗流涌动,我国经济由高
在航空航天、空间攻防、工业流水线以及道路交通中存在大量高速运动的目标,这些目标表面特征复杂,包含各类直线特征、椭圆特征以及其他不规则特征,为了实现目标定位,可以利用目标直线特征参数进行位姿解算,从而确定目标位置信息,而当前直线特征检测速度慢,资源耗费大成为制约高速测量的一个关键问题,因此对运动目标的直线特征进行高速视觉检测成为本论文研究的价值所在。本论文以直线特征的高速检测为目的,通过对系统结构进
中国城乡快速发展产生了环境恶化、资源浪费、地域特色缺失等一系列问题,因此人们越来越重视自然环境,向往世外桃源般的田园生活。与此同时,乡村中良好的生态环境、独特的自然资源、巨大的产业潜力等一系列优势,正日益吸引着大众的目光,逐渐成为经济增长的新焦点。本文以建设长安屯村“田园综合体”为背景,通过对长安屯村生态、交通、产业、文化、旅游资源方面的现状分析,提取当地特色,进行归纳总结,对于进一步的规划设计有
三维有序大孔(3DOM)材料是多孔材料的一个重要的组成部分。多孔材料发展至今,人们对于微孔和介孔材料的研究已经进行的较为深入了。但是,面对如今日益多样的应用,微介孔材料难免有些力有不逮故而需要大孔材料来填补这方面的不足。根据大孔材料本身具有的孔结构排列周期性强、孔径分布窄、大孔尺寸均匀可调等特点,在催化剂及载体,吸附分离,传感以及能量储存及释放等领域有着很不错的应用前景。本文以胶晶模板法为核心技术
18岁,郝明义从韩国只身前往台湾大学就读。走出松山机场,他仰望天空,深深呼吸,将那个九月雨夜的气息纳入肺腑。独立自由的日子,在期盼中终于到来。他虽在韩国出生,因从小在华
丰胸的四种结果:1.大不一样;2.不大一样;3.一样不大;4.不一样大。不要迷恋哥,哥只是个传说;不要迷恋姐,姐会让你吐血。
从广西河流及河流泥沙特征,经济社会发展对泥沙信息的需求变化,以及目前广西悬移质泥沙测验工作存在的误区等对广西悬移质泥沙测验模式改革的紧迫性进行了论述,并提出了改革思路
针对白石牙水库拦河坝建基面缓倾角软弱夹层问题,通过对地质条件的分析研究,结合物探资料,推测其发育范围,据此进行坝基抗滑稳定分析评价,提出相应的处理措施。