VVC帧间几何预测模式优化算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:angelcaoxian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
VVC/H.266(Versatile Video Coding)是新一代视频编码标准。不同于传统的矩形块划分结构,为了使编码单元(Coding Unit,CU)划分更为灵活,VVC引入了几何预测模式(Geometric Prediction merge Mode,GPM)。GPM使用非矩形块的划分结构,将编码块划分为楔形或三角形进行帧间预测过程。带运动矢量细化的GPM模式(Geometric Prediction merge Mode with Motion Vector Refinement)允许在GPM的基础上进行带运动矢量差合并模式(Merge mode with MVD,MMVD)的运动矢量细化,进一步提升了预测的精度。然而,该技术显著增加了计算复杂度,造成了编码时间的大量增加。论文针对上述问题开展研究,主要内容和创新点如下:(1)论文研究了GPM模式选择与CU特性间的关系,提出了一种基于CU梯度的帧间几何预测模式快速决策算法。论文研究发现,采用GPM模式的CU存在明显的子块像素差异,论文采用梯度均值指标来度量这种差异,对不呈现子块像素差异的CU提前终止GPM划分过程。对于呈现子块像素差异的CU,由于GPM的划分方式与CU的纹理边界方向密切相关,论文利用梯度方向指标提前决策GPM划分方式中的量化角度,跳过不必要的划分方式,降低计算复杂度。实验结果表明,与VTM8.0参考模型相比,所提算法在随机访问配置下平均可以节省13.5%的编码时间,Y、U、V分量的BD-rate分别只增加了0.14%、0.13%和0.31%。(2)论文进一步研究了带运动矢量细化的GPM快速决策问题,发现MMVD中运动步长的选择概率与CU的运动剧烈程度密切相关,运动剧烈的CU常选择大步长,而运动不剧烈的CU常选择小步长。论文提出了一种基于感知哈希(Perceptual hash,p-hash)的带运动矢量细化的GPM快速算法,利用p-hash计算参考CU和当前CU的汉明码距,以此度量当前CU的运动剧烈程度;根据CU运动剧烈程度提前决策运动矢量细化过程中的运动步长,跳过不必要的细化方式。实验结果表明,与VTM8.0参考模型相比,所提算法在随机访问配置下平均可以节省9%的编码时间,Y、U、V分量的BD-rate分别只增加了0.01%、0.08%和0.07%。
其他文献
晶体是材料学领域中的一种重要材料,其性能与内部质点排列的规则程度有关,偏离规则状态排列的点阵结构就是晶体缺陷。高分辨率透射电镜(High Resolution Transmission Electron Microscope,HRTEM)图像是晶体缺陷研究的一种重要数据,反映了晶体内部质点排列的微观结构。为了将存在某些缺陷的异常晶体图像与正常晶体图像区分开来,需要对晶体图像进行异常检测,以便后续缺
学位
声音事件检测技术的目的是对采集到的音频进行分析,从而检测出其中的声音事件类别及起止时间。随着我国社会养老需求的增加,声音事件检测技术在居家环境中具有广阔的应用前景。目前,声音事件检测任务中存在着强标签训练数据数量稀缺的问题,这限制了神经网络模型的性能。针对上述问题,本文进行了以下研究:首先,本文搭建了一个卷积循环神经网络(CRNN),该网络使用音频的对数梅尔频谱图作为输入特征,能够利用长期上下文信
学位
表格可以将影响决策的多维度要素有序的存储并清晰的展示出来,是帮助管理者进行决策的有效工具。纵观现有对表格数据的分析方法,有以下问题值得关注:目前的分析方法仅针对包含类别特征与数字特征的表格,无法分析包含主观描述字段的表格;机器学习在表格数据挖掘领域中占主导地位,但决策因素的维度提升会影响分析结果。针对上述问题,如何同时对表格中的数字型特征、类别型特征、主观描述文本特征进行深层次的规律探究,进而辅助
学位
随着生物特征识别的可靠性和准确性指标需求的增加,指静脉识别成为一个广泛研究的重要分支。较之其他的生物特征识别,其具备活体检测功能,且应用较为简便,因此具有重要研究意义。近年来,随着深度学习的广泛应用,识别算法的准确率和鲁棒性不断提高,但如何进一步提升鲁棒性仍存在挑战。论文主要研究工作和创新性如下:(1)为了降低图像扰动对算法提取鲁棒特征的影响,采用有监督和无监督数据增强方法,辅以归一化处理,丰富数
学位
气胸是战创伤环境和灾害应急救援现场中出现的最为常见的伤情。气胸可造成伤员呼吸困难,严重时甚至会威胁伤员的生命,亟需早期的诊断与救治。超声在气胸诊断上的应用逐渐成熟,由于超声设备质量轻,体积小等特点,其在战创伤环境和灾害应急救援现场中已得到了广泛的应用。但是使用超声的医师需要进行长期培训,诊断的结果也往往受到使用者技术水平的影响。大量研究表明,机器学习等模式识别方法逐渐在医学影像和计算机辅助诊断等领
学位
目的:评价熊去氧胆酸胶囊结合扶正化瘀胶囊对酒精肝患者肝功能及肝纤维化相关指标的影响。方法:选取2021年3月—2022年3月我院收治的88例酒精肝患者作为研究对象,采用随机数表法分为对照组(熊去氧胆酸胶囊)和观察组(熊去氧胆酸胶囊结合扶正化瘀胶囊),分析临床治疗效果。结果:观察组血清胆碱酯酶、白蛋白、血清胆固醇水平更高,总胆汁酸水平更低,差异有统计学意义(P<0.05),治疗4周后,观察组HA、L
期刊
随着全球范围内科技的创新与发展,无人驾驶设备在人类生产生活方面占据的地位逐步上升,基于无人驾驶设备的通信系统成为众多领域的研究热点。但是,频谱资源日益紧张和信息传输规模增长迅速是当下亟待解决的难点。为了克服这些难点,协作通信等技术应运而生,并且迅速在众多行业范围内受到高度重视。在无人驾驶设备与这些新技术相结合的过程中,准确有效地获取通信链路中的发送信号和信道状态信息(Channel State I
学位
与高效视频编码(High Efficiency Video Coding,HEVC)相比,通用视频编码(Versatile Video Coding,VVC)进一步提升了压缩性能,码率降低了30%~50%,对4K、8K超高清视频的压缩效果更为显著。由于引入了大量新的编码工具,VVC编码器的时间复杂度大幅增加。为了降低帧间编码模式下VVC编码器的时间复杂度,本文利用编码单元(Coding Unit,
学位
随着人们对高质量视频的需求更加迫切,视频的传输与压缩面临更多的挑战和机遇。为了适用更高分辨率和更多的视频应用场景,2020年7月ITU-T(International Telecommunication Union for Telecommunication Standardization Sector,国际电信联盟远程通信标准化组)推出了新一代编码标准H.266/VVC(Versatile Vi
学位
<正>“七选五”主要考查学生对文章的整体内容、语篇结构及上下文逻辑意义的理解和掌握,培养学生思辨能力。教学中发现学生该题型的答题情况与文章的难易相关度很大,文章简单则得分较易,文章稍难则无从下手。那么,如何在“七选五”的备考中取得突破性进展呢?分析2022和2021年全国高考各卷中的“七选五”试题,我们不难发现,近两年该题型在选材上是遵循一定规律的,而其设空也是有一些共同特点的(见下表)。
期刊