【摘 要】
:
随着5G技术的普及以及视频编解码技术的快速发展,用户对于高清视频、超高清视频的需求日益增长。然而,硬件设备和专利成本的限制成为高质量、高分辨率视频发展的瓶颈。为此,28个视频行业组织在2018年10月提出了基于现有的和未来的视频编解码器上进行软件扩展的市场需求。经过众多视频行业组织的努力,动态图像专家组(Moving Picture Experts Group,MPEG)最终在2020年10月发布
论文部分内容阅读
随着5G技术的普及以及视频编解码技术的快速发展,用户对于高清视频、超高清视频的需求日益增长。然而,硬件设备和专利成本的限制成为高质量、高分辨率视频发展的瓶颈。为此,28个视频行业组织在2018年10月提出了基于现有的和未来的视频编解码器上进行软件扩展的市场需求。经过众多视频行业组织的努力,动态图像专家组(Moving Picture Experts Group,MPEG)最终在2020年10月发布了低复杂度增强视频编码(Low Complexity Enhancement Video Coding,LCEVC)标准。LCEVC在几乎不增加视频编码复杂度的前提下,利用基本层的码流和额外的增强层码流来提高基本编码器的压缩效率,可为用户提供更高分辨率、更高质量的视频。但目前LCEVC性能仍然有待增强,因此本文深入研究了下采样模块并提出了相应的优化算法。针对LCEVC编码器很难实现实时编码的问题,本文对其各个模块设计了并行加速算法,并利用图形处理器(Graphics Processing Unit,GPU)对LCEVC进行并行加速。具体工作如下:1.为增强视频编码性能,本文提出了基于上采样先验的LCEVC下采样优化算法。首先,对LCEVC中下采样算法原理以及实现流程进行分析;其次,结合插值依赖的图像下采样算法,将源视频进行边界填充并分块;最后,根据最小二乘法得到基于上采样先验的LCEVC最优下采样。实验结果表明,所提算法在基本编码器为高级视频编码(Advanced Video Coding,AVC)时,BD-BR降低了5.02%,BDPSNR提高了0.09d B。当基本编码器为高效率视频编码(High Efficiency Video Coding,HEVC)时,BD-BR降低了7.46%,BD-PSNR增加了0.13d B。2.为实现实时编码,本文设计了并行优化算法并基于GPU实现了实时LCEVC编码器。首先,对LCEVC编码器进行耗时分析,设计基于CPU-GPU异构平台的编码器框架;其次,选取编码器中的主要耗时模块进行并行优化设计;最后,在统一计算设备架构(Comput Unified Device Architecture,CUDA)平台上实现并行优化算法。实验结果表明,基于GPU的实时LCEVC编码器在720P视频中可实现54.262fps实时编码,在1080P视频中可实现28.204fps实时编码。
其他文献
移动无线传感器网络(Mobile Wireless Sensor Network,MWSN)中的低功耗有损网络(Low Power and Lossy Networks,LLN)路由协议(Routing Protocol for LLN,RPL)是一种适用于静态场景的路由协议。然而随着人类生产生活方式的不断改变,在RPL路由协议中加入移动传感器成为了必然趋势,如智能家居、医疗交通、智慧农场等。本文
近年来,云计算、物联网和大数据等关键技术的快速发展给作为核心基础设施的数据中心带来了极大的挑战。这些面向数据中心的应用,需要服务器之间高效的互连。这样的互连对数据中心网络链路和交换器提出了更高的带宽需求。同时,为了降低运营成本,数据中心服务器之间的互连必须满足低能耗的需求。因此,如何解决数据中心互连网络中更高带宽、更低能耗问题是当前通信领域的一个重要研究方向。为了提高网络带宽、降低能耗,本文将结合
随着社交媒体的快速发展,用户可以通过各类社交平台发布大量带有个人观点或者情感倾向的视频内容,交流方式不再局限于文本、图像等单一模态。为了更好地利用这类情感数据以便将情感分析广泛运用于心理治疗、视频意见挖掘、自动驾驶等领域,研究人员对情感分析的研究也逐渐从单模态情感分析扩展到多模态情感分析。因此,本学位论文从包含信息种类最多的视频数据出发,从中分离出文本、语音和图像模态,并结合深度学习技术对多模态情
高光谱图像是成像技术和光谱技术相结合产生的,数百个维度的光谱数据对应数百个窄而连续的光谱波段。不断提升的光谱分辨率和空间分辨率使高光谱图像包含丰富的光谱信息和空间位置信息,可应用到农业、生态、地质、医学、气象学等多种领域,受到广泛的关注。在高光谱图像的应用中,分类是一个非常重要的问题,它的目的是使用相关理论和方法获取地物信息,提升高光谱图像的分类精度。本文主要考虑稀疏表示分类方法中字典和空间信息对
在大规模多输入多输出(Multiple input Multiple output,MIMO)系统中,由于天线数量增加,传统MIMO信号检测算法在计算开销和检测精度之间难以平衡,因此设计出具有低计算复杂度和高检测精度的大规模MIMO信号检测算法尤为重要。本文结合深度学习技术和传统信号检测算法,提出全新的适用于大规模MIMO系统的深度检测网络。1.在大规模MIMO系统上行链路中,Richardson
车对车(Vehicle-to-Vehicle,V2V)通信作为实施道路监控、共享路况信息的重要途径,是车联网通信系统不可或缺的一部分。建立准确的V2V信道模型是认识V2V信道特征最有效的手段,但信道特征会受实际场景的影响,尤其是公路隧道由于结构封闭狭长、交通环境复杂,使得信道衰落特征更加复杂。现有V2V信道模型无法做到准确描述隧道环境下的信道特征,本课题立意于建立隧道场景下准确可靠的V2V信道模型
研究表明,到2025年,全球的无线通信将服务的移动设备激增至75亿,移动设备将会十分密集。因此,无线通信网络的资源分配能力以及系统的鲁棒性能亟待提高。智能反射面(Intelligent Reflecting Surface,IRS)作为一种高性价比、高移动性及低功耗的新型技术,能够与目前存在的多种技术,如非正交多址接入(NonOrthogonal Multiple Access Networks,
第五代移动通信(5th Generation Mobile Communication,5G)作为新一代的移动通信技术,其网络结构的复杂性以及应用场景的多样性给5G网络规模化测试带来了巨大的挑战。5G路测仪作为通信产业链中最重要的测试仪表之一,在网络质量评估、网络站点部署以及5G设备验证等方面发挥着重要作用。本课题依托于重庆市重大主题专项“5G路测仪表的研发及应用”,对物理下行共享信道(Physi
随着人工智能技术的发展,人们开始探索如何将智能技术与生活、工作相结合,而行人重识别技术因其可用于公共场所、个人家居等多种场景下的智能安防而备受关注。由于监控摄像头拍到的行人图像存在部分遮挡、分辨率低和光线变化等问题,所以如何克服这些问题并提高行人重识别的性能是一个研究热点。另外,随着Res Net、Dense Net和Google Net等不同结构的网络被提出,很多工作开始致力于设计性能更好的体系
感知网络中需要多个传感器对周围环境进行信息感知,并将收集到的信息传输到数据中心进行处理。然而,在自然环境中多个传感器放置在不同位置采集同类型的信息,传感器容易受到外界的干扰与自身性能的局限,导致采集到不正常数据甚至是错误数据,这些数据会影响最后的决策判断。针对上面所提到的问题,本文主要研究如何在提高同类型数据可靠度和减少数据冗余的基础上,通过构建新的数据融合模型来缓解冲突数据对多种类型数据融合带来