基于强化学习的视觉敏感度感知自适应比特率算法研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:wapp592
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,视频流流量持续增长,已经占据互联网总流量的主要部分。为了应对网络带宽的波动性,提供流畅的视频播放服务,自适应视频流技术被提出。目前,自适应比特率(Adaptive Bitrate,ABR)算法被广泛应用于基于HTTP的动态自适应流(Dynamic Adaptive Streaming over HTTP,DASH),以提高用户体验质量(Quality of Experience,Qo E)。传统的ABR算法通常仅根据播放器和网络环境选择视频块的比特率,而忽略了视频内容特性对用户Qo E的影响。因此,内容感知的ABR算法被提出并成为当前的主流。然而,现有算法的比特率决策仍忽略了人类视觉系统(Human Visual System,HVS)固有的视觉敏感度特性。由于HVS对不同视频内容的质量失真具有不同的敏感度,具有高视觉敏感度的视频内容需要分配更多的比特率资源。因此,现有ABR算法在合理分配比特率和最大化用户Qo E方面仍然存在局限性。针对这一问题,本文从用户视觉的角度出发设计自适应比特率策略,对视觉敏感度的建模方法进行了研究,并结合强化学习(Reinforcement Learning,RL)技术,提出了一种视觉敏感度感知的自适应比特率算法。本文的主要研究贡献如下:1.由于HVS作用机制的复杂性,现有的视觉敏感度建模方法在模拟HVS特性方面仍存在不足。本文在分析不同视觉掩蔽效应对HVS感知视频质量失真影响的基础上,针对不同视频内容建立了总体掩蔽效应模型。该模型采用多种视频特征作为输入,并将多流前馈卷积神经网络(Convolutional Neural Network,CNN)与反馈模块相结合以模拟HVS感知机制。与现有最新的模型相比,该模型能更准确地反映视觉敏感度大小。2.本文分析了总体掩蔽效应模型的预测结果与视觉敏感度的对应关系,以对视觉敏感度进行量化。通过将该视觉敏感度信息与RL算法的输入状态和奖励函数相结合,提出了视觉敏感度感知的ABR算法。该算法能够生成与视觉敏感度相一致的比特率策略,并基于更精确的视觉敏感度信息进行比特率分配,进一步优化资源利用率和用户感知质量。3.通过广泛的实验评估和分析,与最新的视觉敏感度预测方法相比,本文提出的总体掩蔽效应模型的预测精度更高,且对视频分辨率具有鲁棒性。与不考虑视觉敏感度的ABR算法相比,所提出的算法在许多指标上均实现了良好的性能,并将用户Qo E提高约22.8%。与基于其他视觉敏感度预测方法的ABR算法相比,本文提出的ABR算法也实现了一定程度的用户感知质量提升。
其他文献
步态识别是一种新兴的身份认证技术,它的核心思想是利用人们行走时展现的步态信息进行身份认证。Kinect设备可以实现人体骨骼的空间定位和追踪,同时实时输出步态运动的3D骨骼信息,为人物识别提供了有效的骨骼数据。本文针对目前Kinect 3D骨骼的步态识别研究在数据归一化和特征提取方面存在的问题,提出了两种基于Kinect 3D骨骼数据的人物识别方法——基于关节点坐标图像的单帧人物识别方法和基于步态时
学位
垃圾回收的好处很多,其有助于保护水土资源,提高居民的生活环境质量,加快绿色循环经济发展。然而传统的垃圾回收需要大量人力和物力。为了获得更高的精度,目标检测模型通常带有巨大的参数量和复杂的结构。本研究提出了一个更轻量和高效的YOLOv5s改进模型,将其用于对可回收垃圾的分类和定位,并结合可回收垃圾检测的应用开发进行相关的实践。主要的工作如下:1、对原YOLOv5s网络中,参数量较大的问题、计算复杂的
学位
通过注射给予患者药物,已成为日常诊治不可或缺的一部分。而医护人员培训注射的实操对象多为动物活体、硅胶手臂模型、手术训练箱,这些材料无法满足医护人员培训阶段所需材料重复性高、真实感强的要求。因此,本文从实用性出发,以注射操作为研究对象,设计并实现了一个具有力反馈、复用性强的虚拟注射仿真系统。主要研究内容如下:(1)手臂模型的真实形变。为实现手臂模型真实的形变效果,提出了一个四面体耦合扩展位置动力学的
学位
随着时代的不断发展,通信技术突飞猛进的同时,也带来大数据时代的各种挑战。集成光学系统可以大大降低设备的制造成本,提高信息传输能力,可以广泛的应用于片上光互连中。片上光互连的基础是集成光学器件,所以对关键器件的研究和设计至关重要。在追求光子芯片高度集成化的过程中,提出了一种新的逆向设计方法,克服了手工调整参耗时长和器件尺寸大的缺点。通过优化算法实现逆向设计,设计的器件不仅体积小、损耗低,而且能够实现
学位
新时期为了实现高质量、可持续发展,提出了碳达峰、碳中和(即“双碳”)战略目标。当前市场竞争日益激烈,科技型中小企业要想获得充足的发展空间,就要增强自身竞争实力,而“双碳”战略则为企业发展带来了全新的契机,同样也使企业面临更大的挑战。新科技型中小企业只有贯彻绿色管理理念,在生产经营过程中强化绿色管理,才能够顺应时代发展趋势,有效均衡自身经济效益和社会经济效益,在市场竞争中站稳脚跟,实现可持续发展。
期刊
2022年版课标明确指出以学习任务群的形式组织与呈现课程内容,推动课堂教学变革。教师要在领会学习任务群的旨归下,树立单元整体意识,精准定位习作单元内各板块的功能,进行整体设计单元教学,体现“教—学—评”的一致性,促进学习深度发生,助力学生语文核心素养的发展。
期刊
三维视觉成像在逆向工程、医学成像、虚拟/增强现实、元宇宙等方面有着重要的应用。单帧条纹投影轮廓术作为一种非接触式的主动三维视觉成像测量方法,具有便捷性强、精度高、可成像动态物体的优点。而相位提取是单帧条纹投影轮廓术中最重要的步骤,其主要包括包裹相位提取、相位展开以及非线性载波相位去除三个主要环节。在单帧条纹图像相位提取的各个环节中,现有的方法还面临着如下挑战:(1)非线性载波相位去除方法的精度不高
学位
随着科技的发展,软件对终端设备计算能力的需求与日俱增。然而,终端设备的性能与能耗成正相关,如何在终端设备能量约束的条件下满足软件性能需求成为当前的研究热点之一。边缘计算技术是解决终端设备能耗与性能问题的主要技术之一,该技术将终端设备的计算任务卸载至边缘网络进行计算,这不仅可以降低软件对终端设备的性能需求,还可以减少终端设备的能量消耗,达到能耗与性能平衡的目的。目前,许多边缘计算卸载方案只针对单一场
学位
环状RNA(circRNA)是一种没有3和5端腺苷酸尾的非编码RNA。由于其为环形结构,与线性RNA相比,它稳定性更高。近年来高通量序列检测技术发展迅速,越来越多的研究表明环状RNA参与到了多种生命过程中,并与人体的多种疾病(阿兹海默症、心脏病、糖尿病、癌症)有着密切的关系。预测环状RNA与疾病的关系有助于了解疾病的发病机理,也有利于诊断和治疗疾病。传统检测环状RNA与疾病的潜在关系方法一般是基于
学位
磁场作为一个基础物理量与人类生活息息相关,它既有强度上的大小,也有方向上的不同。目前,用于探测磁场的磁场传感器已经被广泛地运用在在工业、军事和生物医学等方面。传统的磁场传感器多是电学式传感器,主要存在占用空间大、成本高、抗电磁干扰弱等弊端,而光纤磁场传感器已经成为了下一代全光传感器网的关键部分,具备集成度高、敏感度高、抗电磁干扰能力强等优势,并且便于集成复用在现有全光传感网络当中,以达到更高效、高
学位