VVC的帧间快速ME算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:hyc1958
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对高质量视频的需求更加迫切,视频的传输与压缩面临更多的挑战和机遇。为了适用更高分辨率和更多的视频应用场景,2020年7月ITU-T(International Telecommunication Union for Telecommunication Standardization Sector,国际电信联盟远程通信标准化组)推出了新一代编码标准H.266/VVC(Versatile Video Coding,通用视频编码),与上一代编码标准H.265/HEVC(High Efficiency Video Coding,高效视频编码)相比,VVC在节省平均比特率的同时,也带来了高昂的计算成本。研究发现,仿射运动模式(Affine Motion Mode,AMM)在新的编码框架中带来了巨大的运算复杂度。本课题主要研究VVC帧间预测中仿射运动估计的快速算法,主要从仿射运动模式的提前决策和仿射四、六参数的快速决策两个方面展开工作,实现编码时间的降低。针对仿射运动估计决策中的计算复杂度大的问题,本文提出了FARD(Fast Affine Region Determination,快速仿射区域确定)算法。算法首先基于帧间差分法和Prewitt纹理梯度算子对仿射运动区域进行提前决策;然后根据VVC中的多类型树(Multiple Tree Type,MTT)结构,在父块属于仿射运动区域时判断其子块的最佳预测模式,当存在多个以仿射运动模式为最佳预测模式的子块时,则使用父块进行仿射运动模式的编码;同时,通过调整帧间差分法的阈值减少了部分平缓运动的ME情况,从而进一步降低了ME的计算复杂度。在仿射四、六参数模型匹配过程中需要通过大量的RDO计算,造成了较高的复杂度。在本文的研究中提出了基于SATD(Sum of Absolute Transformed Difference)代价的时域同位块合并候选的四、六参数快速决策算法。算法首先通过前向/后向的参考帧获得同位块信息,将当前的候选列表进行扩展,并对同位块的CPMV与当前块候选进行合并;然后通过SATD代价的计算得到最优候选,并对合并的候选列表按代价由低到高排序;最终根据代价顺序对四、六参数进行快速决策。同时,根据四、六参数运动补偿的残差值进行了MVD的精度细化。实验结果表明,与VTM11.0的原始测试框架相比,在保证主观视频图像质量基本不变化的前提下,在RA(Random,随机接入)模式和LDP(Low Delay P,低延迟P帧)模式下,FARD算法的编码时间平均节省了17.52%和14.64%,BD-RATE仅增加0.43%和0.71%。基于SATD的四、六参数快速决策算法与FARD算法进行的联合测试中同样测试了RA和LDP两种模式,编码时间分别节省了21.44%和24.49%,BD-RATE分别增加了0.64%和0.74%。
其他文献
毫米波雷达是交通流检测领域的主要传感器,多目标航迹提取是该领域研究的热点问题,无监督的数据聚类算法是解决该问题的主要技术手段之一。本文针对雷达多径噪声和点云稀疏引起的聚类错误问题,自动目标数估计问题及目标关联跟踪问题,开展的主要研究工作包括:(1)针对毫米波雷达交通目标实际采集数据的时空变化特点,本文分别进行了非序列特征分析和序列特征分析。在非序列特征分析方面,采用最大似然统计分析,给出了有效数据
学位
随着近些年来城市环境中监控摄像装置的部署量飞速增长以及智慧城市等一系列项目建设需求的提出,基于监控视频的人体异常行为感知技术成为了当前研究的重点方向,具有很高的研究价值和广阔的应用落地需求。但由于单一人体或人群的运动特征与外部环境的复杂多变性,当前人体异常行为识别与感知技术仍具挑战。当前阶段,基于监控视频的异常行为感知技术还停留在识别简短视频中的简单或单一的异常行为,无法快速有效处理大量且复杂的监
学位
晶体是材料学领域中的一种重要材料,其性能与内部质点排列的规则程度有关,偏离规则状态排列的点阵结构就是晶体缺陷。高分辨率透射电镜(High Resolution Transmission Electron Microscope,HRTEM)图像是晶体缺陷研究的一种重要数据,反映了晶体内部质点排列的微观结构。为了将存在某些缺陷的异常晶体图像与正常晶体图像区分开来,需要对晶体图像进行异常检测,以便后续缺
学位
声音事件检测技术的目的是对采集到的音频进行分析,从而检测出其中的声音事件类别及起止时间。随着我国社会养老需求的增加,声音事件检测技术在居家环境中具有广阔的应用前景。目前,声音事件检测任务中存在着强标签训练数据数量稀缺的问题,这限制了神经网络模型的性能。针对上述问题,本文进行了以下研究:首先,本文搭建了一个卷积循环神经网络(CRNN),该网络使用音频的对数梅尔频谱图作为输入特征,能够利用长期上下文信
学位
表格可以将影响决策的多维度要素有序的存储并清晰的展示出来,是帮助管理者进行决策的有效工具。纵观现有对表格数据的分析方法,有以下问题值得关注:目前的分析方法仅针对包含类别特征与数字特征的表格,无法分析包含主观描述字段的表格;机器学习在表格数据挖掘领域中占主导地位,但决策因素的维度提升会影响分析结果。针对上述问题,如何同时对表格中的数字型特征、类别型特征、主观描述文本特征进行深层次的规律探究,进而辅助
学位
随着生物特征识别的可靠性和准确性指标需求的增加,指静脉识别成为一个广泛研究的重要分支。较之其他的生物特征识别,其具备活体检测功能,且应用较为简便,因此具有重要研究意义。近年来,随着深度学习的广泛应用,识别算法的准确率和鲁棒性不断提高,但如何进一步提升鲁棒性仍存在挑战。论文主要研究工作和创新性如下:(1)为了降低图像扰动对算法提取鲁棒特征的影响,采用有监督和无监督数据增强方法,辅以归一化处理,丰富数
学位
气胸是战创伤环境和灾害应急救援现场中出现的最为常见的伤情。气胸可造成伤员呼吸困难,严重时甚至会威胁伤员的生命,亟需早期的诊断与救治。超声在气胸诊断上的应用逐渐成熟,由于超声设备质量轻,体积小等特点,其在战创伤环境和灾害应急救援现场中已得到了广泛的应用。但是使用超声的医师需要进行长期培训,诊断的结果也往往受到使用者技术水平的影响。大量研究表明,机器学习等模式识别方法逐渐在医学影像和计算机辅助诊断等领
学位
目的:评价熊去氧胆酸胶囊结合扶正化瘀胶囊对酒精肝患者肝功能及肝纤维化相关指标的影响。方法:选取2021年3月—2022年3月我院收治的88例酒精肝患者作为研究对象,采用随机数表法分为对照组(熊去氧胆酸胶囊)和观察组(熊去氧胆酸胶囊结合扶正化瘀胶囊),分析临床治疗效果。结果:观察组血清胆碱酯酶、白蛋白、血清胆固醇水平更高,总胆汁酸水平更低,差异有统计学意义(P<0.05),治疗4周后,观察组HA、L
期刊
随着全球范围内科技的创新与发展,无人驾驶设备在人类生产生活方面占据的地位逐步上升,基于无人驾驶设备的通信系统成为众多领域的研究热点。但是,频谱资源日益紧张和信息传输规模增长迅速是当下亟待解决的难点。为了克服这些难点,协作通信等技术应运而生,并且迅速在众多行业范围内受到高度重视。在无人驾驶设备与这些新技术相结合的过程中,准确有效地获取通信链路中的发送信号和信道状态信息(Channel State I
学位
与高效视频编码(High Efficiency Video Coding,HEVC)相比,通用视频编码(Versatile Video Coding,VVC)进一步提升了压缩性能,码率降低了30%~50%,对4K、8K超高清视频的压缩效果更为显著。由于引入了大量新的编码工具,VVC编码器的时间复杂度大幅增加。为了降低帧间编码模式下VVC编码器的时间复杂度,本文利用编码单元(Coding Unit,
学位