基于CU特性的VVC编码块划分决策算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户：z360052113

【摘要】

：

【作者】

：

董孟军

【机构】

：

北方工业大学

【出处】

：

北方工业大学

【发表日期】

：

2021年01期

【关键词】

：

H.266/VVC 帧内预测多类型树 CU划分 ISP编码模式

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通用视频编码（Versatile Video Coding,VVC）已于2020年7月正式发布,在显著提高编码效率的同时,大大增加了计算复杂度。文献研究表明,与四叉树划分结构相比,VVC引入的多类型树（Multi-type Tree,MTT）划分结构大约增加了9倍左右的编码时间。为了降低VVC编码块划分的计算复杂度,论文基于编码单元（Coding Unit,CU）特性,从多类型树划分、帧内子划分（Intra Sub-partition,ISP）编码模式两个方面展开研究,设计快速决策算法,减少编码时间。主要研究内容和创新点如下:（1）针对CU多类型树划分计算复杂度大的问题,论文研究了编码块划分方式与像素分布间的关系,发现二叉树和三叉树的方向选择与CU的子块像素差异密切相关。论文提出了一种基于子块像素差异的多类型树快速决策算法,定义了SBPD（Pixel Difference of Sub-block）指标来衡量不同划分方式下CU的子块像素差异,通过比较水平和垂直子块的SBPD值,提前决策二叉树和三叉树的模式选择,跳过部分冗余划分模式,节省编码时间;此外,论文还利用统计方法对判决门限进行了优化。实验结果表明,与参考模型VTM-4.0相比,全帧内（All Intra,AI）配置下该算法平均节省27%的编码时间,BD-rate仅提高0.55%。（2）ISP编码模式是VVC标准中新增的帧内编码关键技术。论文通过分析ISP编码模式下不同纹理特点CU的率失真代价,发现ISP编码模式对于纹理简单CU的性能提升不明显。论文提出了一种基于CU纹理复杂度的ISP编码模式快速决策算法,通过比较编码块的纹理复杂度,提前决策当前CU是否采用ISP编码模式,在不明显降低性能的同时减少ISP编码模式的使用频率,节约编码时间。算法设计了基于间隔采样的CU纹理复杂度计算方法,并利用率失真代价优化判决门限。实验结果表明,与参考模型VTM-8.0相比,全帧内配置下该算法平均节省7%的编码时间,BD-rate仅提高0.09%。

其他文献

基于图像的智能测量技术研究

网络购物时代的来临,使得物流运输业变得日益重要,日常小件货物的分拣、存放、运输等问题也越来越突出,其中必然会涉及物体的重量和尺寸信息。尺寸信息也就是物体的体积。如何智能化、自动化地获取物体的体积信息是亟待解决的问题。而已有的视觉测量技术,大多需要人工进行物体的定位检测、识别以及角点、边缘线等的提取,考虑到近年来深度学习理论在物体识别等方面的成功应用,本文以此为研究背景,系统探讨了在深度学习框架下利

学位

单目测量单应矩阵Mask R-CNN体积测量

基于模型验证的视觉跟踪算法

目标跟踪广泛应用于智能家居、医学诊断、交通视频监管等多个领域。随着相关滤波、深度学习的理论知识和计算机存储设备的迅速发展,判别式跟踪算法逐渐成为目标跟踪领域的主要发展趋势。判别式跟踪算法将目标跟踪问题转变成跟踪的目标与背景之间的二分类问题。因此算法先利用正负样本训练前景与背景的分类器,然后用该分类器在后续帧中找到最优目标区域。判别式跟踪算法的核心是目标定位、尺度以及速度三个问题,本文在判别预测模型

学位

视觉跟踪判别预测模型掩膜分割模型模型融合模型验证

基于深度学习的超分辨率方法研究

为了满足人们的精神文化需要,尤其是影音娱乐方面,超高清技术正处于大力发展阶段。但由于成像硬件设备的价格高昂,靠提升硬件来提高清晰度显然是无法大面积实行的。随着近些年深度学习的发展,依靠神经网络来进行超分辨率重构已经如火如荼,其不光成本低廉、便于部署,且重构效果已经超越了很多传统算法。超分辨率,其目标是从低分辨率图像中尽可能的恢复更多的细节信息,使图像变得更清晰,更容易被人眼所接受。针对单帧图像超分

学位

深度学习超分辨率摩尔纹去噪

基于Transformer的自动问答技术研究

随着大数据时代的到来,计算机与移动网络的飞速发展。我们已经迎来了5G网络,人们获取信息的途径越来越多,每天数以亿计的信息留存于互联网上。丰富的信息资源在互联网上构建了一个大型知识库满足人们对未知信息的渴望。但是,庞大的信息量也让人们很难快速得到有价值的信息,如何快速筛选有价值的信息是当前亟待解决的难题。自动问答系统可以根据用户所提出的问题,自动挖掘问题的语义信息,并快速匹配得到问题的正确答案反馈给

学位

预训练模型迁移学习数据扩充TransformerBERT

基于生成对抗网络的地基SAR多源数据融合算法研究

地基合成孔径雷达（Ground-based Synthetic Aperture Radar,地基SAR）系统具有非接触、高精度、大区域连续监测的技术优势,是进行区域性监测、地表形变监测以及定点连续测量的重要手段。传统地基SAR图像多源数据融合算法,一般基于坐标转换或特征匹配的方法实现,需要人工提取地基SAR系统、监测点坐标进行转换计算,难以实现自动化。利用生成对抗网络模型也可以实现地基SAR图像

学位

地基SAR坐标转换俯仰角模糊多源数据融合循环一致性生成对抗网络

基于属性学习的车辆再识别研究

近几年,中国经济发展逐步趋于稳定,绝大部分家庭均选用了汽车这一交通工具,从而使我国的汽车保有量稳步上升,但随之面临的各类交通问题也是与日俱增。为了解决这些实际交通问题,车辆再识别技术应运而生并逐渐走入人们的视野中。然而,仅仅通过车辆的颜色或车型等部分单一的车辆属性来进行车辆重识别很难取得较高的准确率。再加上真实场景下例如不明物体的遮挡、分辨率低、角度变化等诸多外界因素的影响,使得车辆重识别要想获得

学位

车辆再识别属性识别卷积神经网络多任务学习OSNet

社区燃气设施风险监测和预警系统设计

燃气作为我国社区居民生活的必需品,近年来使用量不断增加,燃气安全稳定越发重要。燃气设施泄漏预警是保障燃气设施安全运行的一项重要手段,但传统的燃气设施泄漏预警方法主要依赖专家经验,实时性和智能化水平不足。本文将数据采集、视频监控、机器学习和可视化技术相结合,进行社区燃气设施风险监测和预警系统的设计。主要开展了以下4个方面的工作:（1）基于6Lo WPAN协议开发无线传感器网络采集社区燃气数据,通过树

学位

燃气泄漏在线监测模糊控制算法随机森林算法泄漏预警可视化

10bit 160MSPS分段式电流舵型DAC的设计

数模转换器（digital to analog coverter,DAC）是无线通信系统中的关键模块,用于接收数字信号并完成数字信号到模拟信号的转换,因此DAC的研究也受到了广泛的关注,研制出高性能、低功耗、低面积的DAC具有深厚的研究意义。在此背景下,本次课题基于中芯国际55nm工艺,以分段式电流舵型DAC电路设计为核心,主要取得了以下研究成果:1.基于分段式电流舵型DAC电路结构,研制出了一款

学位

DAC分段式电流舵型版图布局低功耗

基于强化学习的指路标志指引路径优化研究

指路标志作为重要的交通控制设施,担负着向驾驶员传递道路信息的作用,是城市交通系统中必不可少的一部分。为了完善现有的指路标志指引路径规划方法,本文结合指路标志的信息过载问题和指引路径规划问题展开研究。指路标志指引路径规划的目的是满足驾驶员出行需求和降低指路标志的管理成本,因此综合考虑驾驶员出行成本及指路标志布设成本构建目标函数。通过归一化处理影响驾驶员在指引路径的起讫点间出行的因素,利用路径长度、道

学位

指路标志路径规划A*算法强化学习

基于GAN的不平衡数据研究

学位

基于CU特性的VVC编码块划分决策算法研究

与本文相关的学术论文