面向AVS3的帧内编码优化技术的研究和实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:tcrct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频编码将原始视频数据压缩成视频码流,在保证了编码视频质量的同时极大降低了视频的数据量。随着超高清、虚拟现实等应用的发展,视频数据量及视频内容的增加,给视频的传输和存储带来了压力。为了适应不断增长的视频数据以及丰富的视频内容,新一代视频编码标准AVS3的制定已在进行中。AVS3在AVS2标准的基础上添加了大量新的技术,在保持视频质量一致的前提下实现了更高的压缩率。同时,大量新技术的应用也使得编码复杂度急剧上升。为了加速编码时间,减少编码的复杂度,本文对AVS3中的帧内编码优化技术展开研究,并对帧内预测滤波技术以及对帧内块划分过程的优化算法进行了深入的研究。本文的具体工作如下:1.针对帧内编码过程,本文对AVS3中帧内编码的复杂度进行了分析,并提出了一种针对帧内预测滤波技术(Intra Prediction Filter,IPF)的快速算法。在帧内预测过程中,两次模式粗选(Rough Mode Decision,RMD)的结果之间有一定的相关性。基于此,本算法利用第一次RMD过程(不使用IPF)的结果减少了第二次RMD过程(使用IPF)中需要遍历的候选数量。算法在第一次RMD过程中,记录下Hadamard Cost最小的部分帧内模式候选,在第二次RMD过程中,只遍历记录下来的那些模式候选。实验结果表明,该算法在编码软件HPM4.0和SVT-AVS3上分别有16%和10%的时间节省,同时BD-rate Y分别只增加了 0.06%和0.03%。2.针对帧内编码中的块划分过程,本文从减少块划分尝试次数入手,提出了基于决策树的快速算法以及基于最佳帧内预测模式的快速算法。首先,针对基于决策树的快速算法,本文使用当前块以及子块的纹理特征以及帧内预测信息作为特征,对两类决策树进行离线训练。一类用于判断是否尝试BT(Binary Tree)划分,另一类应用于判断是BT水平划分还是BT垂直划分。本文对每种尺寸的块分别进行训练,并在算法中对部分训练结果相对较好的尺寸应用决策树进行判决。实验结果表明,在编码软件SVT-AVS3上,该算法在BD-rate Y增加0.81%的情况下,可减少17%的帧内编码时间。之后,针对基于最佳帧内预测模式的快速算法,本文根据统计结果选择了单独对模式12和24进行优化。当不划分时的最佳帧内预测模式为12时,直接对当前块关闭水平BT划分,而当最佳帧内预测模式为24时则直接关闭垂直BT划分。实验结果表明,该算法在在编码软件SVT-AVS3上平均可减少14%的帧内编码时间,同时BD-rate Y平均为0.41%。在只对模式24进行优化时,算法可实现12%的帧内编码时间节省,同时 BD-rate Y 仅为 0.21%。
其他文献
唇读是一种仅靠唇部运动传递的视觉信息识别说话人言语信息的技术,其也被称为视觉语音识别。唇读技术不受声音信号信噪比高低的影响,能够克服语音识别在复杂场景下的不足,因此开展对唇读技术的研究能够拓宽人机交互的应用场景,具有重要的研究意义和使用价值。唇读涉及计算机视觉、自然语言处理等领域相关技术,是一种综合性较强具有一定的挑战性的学科。随着人工智能技术的快速发展,基于数据驱动的深度学习为唇读技术提供了新的
人们在日常生活中经常使用社交媒体发布自己的状态表达自己的情感,其中不乏具有讽刺倾向的评论,该评论表面的情感往往与真实情感相悖,因此正确识别评论的讽刺特征成为讽刺检测的重要任务。讽刺检测旨在判别目标文本中是否含有讽刺倾向,由于判别该文本需要深度语义信息,因此讽刺检测是情感分析乃至自然语言处理中一项具有挑战的工作。从研究角度来看,讽刺检测可以分为基于目标文本和联合上下文信息两个角度展开研究。从研究方法
非线性发展方程已经被作为描述流体等物理领域中的非线性现象的模型。通过研究非线性发展方程的解析解的特征,可以为一些物理实验的提供理论支持。本文的主要内容是解析研究了流体等物理领域中的三个非线性发展方程。本文的主要工作总结如下:(1)研究了(3+1)维广义Calogero-Bogoyavlenskii-Schiff方程的lump解、混合lump-条形孤子解、混合畸形波-条形孤子解和呼吸子解的性质。根据
随着现代无线通信技术的不断发展,频谱资源利用率低和无线终端能量受限等问题逐渐凸显,全双工和无线携能通信技术的融合受到了学者们的关注。对于无线携能通信系统,非线性能量采集模型是近些年的热门研究点。由于实际情况下很难获得理想且完美的信道状态信息,非完美信道模型受到了越来越多的重视。本文在结合上述技术的基础上,在系统模型和优化算法上展开研究。本文研究了基于非线性能量采集模型和非完美信道模型的全双工多用户