VVC运动矢量预测及多叉树划分优化算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:ArchrSaber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与高效视频编码(High Efficiency Video Coding,HEVC)相比,通用视频编码(Versatile Video Coding,VVC)进一步提升了压缩性能,码率降低了30%~50%,对4K、8K超高清视频的压缩效果更为显著。由于引入了大量新的编码工具,VVC编码器的时间复杂度大幅增加。为了降低帧间编码模式下VVC编码器的时间复杂度,本文利用编码单元(Coding Unit,CU)的时间与空间相关性,研究了扩展的Merge预测和多叉树划分决策快速算法。主要内容和创新点如下:(1)VVC对Merge技术进行了大量改进,在提高运动矢量(Motion Vector,MV)预测效率的同时,增加了Merge决策过程的时间复杂度。本文基于对Skip模式的统计分析,提出了一种基于CU运动特征的Skip模式早期决策算法。本文统计发现,帧间编码模式下,编码块采用Skip模式作为最佳预测模式的概率较高,且Skip模式选择与编码块运动剧烈程度具有较大的相关性,运动平缓块有较高概率选择Skip模式。算法设计了三帧差分法来判断当前CU的运动情况,将运动平缓块的MV预测模式提前判决为Skip模式,并利用粗选过程中的SATD(Sum of Absolute Transformed Difference)代价确定具体Skip模式(Affine_Skip或Merge_Skip);对于未判决为Skip模式的CU,算法利用空间相关性判决是否为仿射Merge模式或普通Merge模式;对于前两步均无法判决的CU,则采用标准过程进行判决。实验结果显示,与VTM-11.2相比,所提算法在随机访问配置下平均编码时间下降22.36%,BD-rate仅上升1.08%,PSNR仅下降0.04d B。(2)研究了多叉树划分与编码块运动程度及纹理特性之间的关系,提出一种基于时空相关性的帧间多叉树划分快速算法。在帧间编码模式下,运动剧烈或纹理复杂的编码块通常会被进一步划分,相对静止且纹理简单的背景区域一般采用大块表示。算法利用平方差和的均值(Average Sum of Square Difference,ASSD)和梯度幅值分别描述编码块运动程度和纹理复杂度,对运动平缓且纹理简单的CU提前终止多叉树划分;对需要继续划分的CU,则利用梯度方向预测划分方向,减少不必要的划分模式。实验结果显示,与VTM-11.2相比,所提算法在随机访问配置下平均编码时间下降25.06%,BD-rate仅上升1.23%,PSNR仅下降0.03d B。
其他文献
“结构、性能及分子运动”三者之间制约关系是高分子物理的核心内容,其中“分子运动”的知识最为抽象,是学生学习的难点内容。针对此问题,融入教师科研成果,设计了“形状记忆的聚乳酸/聚碳酸亚丙酯共混材料的结构与性能”综合实验。通过该实验,学生系统而具体的理解“结构与分子运动”、“分子运动与力学性能”、“分子运动与形状记忆功能”的知识,掌握热分析、扫描电镜、力学性能以及形状记忆功能的实验技术,体会高分子基础
期刊
毫米波雷达是交通流检测领域的主要传感器,多目标航迹提取是该领域研究的热点问题,无监督的数据聚类算法是解决该问题的主要技术手段之一。本文针对雷达多径噪声和点云稀疏引起的聚类错误问题,自动目标数估计问题及目标关联跟踪问题,开展的主要研究工作包括:(1)针对毫米波雷达交通目标实际采集数据的时空变化特点,本文分别进行了非序列特征分析和序列特征分析。在非序列特征分析方面,采用最大似然统计分析,给出了有效数据
学位
随着近些年来城市环境中监控摄像装置的部署量飞速增长以及智慧城市等一系列项目建设需求的提出,基于监控视频的人体异常行为感知技术成为了当前研究的重点方向,具有很高的研究价值和广阔的应用落地需求。但由于单一人体或人群的运动特征与外部环境的复杂多变性,当前人体异常行为识别与感知技术仍具挑战。当前阶段,基于监控视频的异常行为感知技术还停留在识别简短视频中的简单或单一的异常行为,无法快速有效处理大量且复杂的监
学位
晶体是材料学领域中的一种重要材料,其性能与内部质点排列的规则程度有关,偏离规则状态排列的点阵结构就是晶体缺陷。高分辨率透射电镜(High Resolution Transmission Electron Microscope,HRTEM)图像是晶体缺陷研究的一种重要数据,反映了晶体内部质点排列的微观结构。为了将存在某些缺陷的异常晶体图像与正常晶体图像区分开来,需要对晶体图像进行异常检测,以便后续缺
学位
声音事件检测技术的目的是对采集到的音频进行分析,从而检测出其中的声音事件类别及起止时间。随着我国社会养老需求的增加,声音事件检测技术在居家环境中具有广阔的应用前景。目前,声音事件检测任务中存在着强标签训练数据数量稀缺的问题,这限制了神经网络模型的性能。针对上述问题,本文进行了以下研究:首先,本文搭建了一个卷积循环神经网络(CRNN),该网络使用音频的对数梅尔频谱图作为输入特征,能够利用长期上下文信
学位
表格可以将影响决策的多维度要素有序的存储并清晰的展示出来,是帮助管理者进行决策的有效工具。纵观现有对表格数据的分析方法,有以下问题值得关注:目前的分析方法仅针对包含类别特征与数字特征的表格,无法分析包含主观描述字段的表格;机器学习在表格数据挖掘领域中占主导地位,但决策因素的维度提升会影响分析结果。针对上述问题,如何同时对表格中的数字型特征、类别型特征、主观描述文本特征进行深层次的规律探究,进而辅助
学位
随着生物特征识别的可靠性和准确性指标需求的增加,指静脉识别成为一个广泛研究的重要分支。较之其他的生物特征识别,其具备活体检测功能,且应用较为简便,因此具有重要研究意义。近年来,随着深度学习的广泛应用,识别算法的准确率和鲁棒性不断提高,但如何进一步提升鲁棒性仍存在挑战。论文主要研究工作和创新性如下:(1)为了降低图像扰动对算法提取鲁棒特征的影响,采用有监督和无监督数据增强方法,辅以归一化处理,丰富数
学位
气胸是战创伤环境和灾害应急救援现场中出现的最为常见的伤情。气胸可造成伤员呼吸困难,严重时甚至会威胁伤员的生命,亟需早期的诊断与救治。超声在气胸诊断上的应用逐渐成熟,由于超声设备质量轻,体积小等特点,其在战创伤环境和灾害应急救援现场中已得到了广泛的应用。但是使用超声的医师需要进行长期培训,诊断的结果也往往受到使用者技术水平的影响。大量研究表明,机器学习等模式识别方法逐渐在医学影像和计算机辅助诊断等领
学位
目的:评价熊去氧胆酸胶囊结合扶正化瘀胶囊对酒精肝患者肝功能及肝纤维化相关指标的影响。方法:选取2021年3月—2022年3月我院收治的88例酒精肝患者作为研究对象,采用随机数表法分为对照组(熊去氧胆酸胶囊)和观察组(熊去氧胆酸胶囊结合扶正化瘀胶囊),分析临床治疗效果。结果:观察组血清胆碱酯酶、白蛋白、血清胆固醇水平更高,总胆汁酸水平更低,差异有统计学意义(P<0.05),治疗4周后,观察组HA、L
期刊
随着全球范围内科技的创新与发展,无人驾驶设备在人类生产生活方面占据的地位逐步上升,基于无人驾驶设备的通信系统成为众多领域的研究热点。但是,频谱资源日益紧张和信息传输规模增长迅速是当下亟待解决的难点。为了克服这些难点,协作通信等技术应运而生,并且迅速在众多行业范围内受到高度重视。在无人驾驶设备与这些新技术相结合的过程中,准确有效地获取通信链路中的发送信号和信道状态信息(Channel State I
学位