基于AVS3视频编码的快速算法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:mingtiandetianming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频是当今社会中十分重要的信息媒介,尤其是近几年来随着显示、网络、存储、计算设备突发猛进的发展,人们对于4K超高清、高动态范围、高帧率、多维度、实时性视频的需求越来越大,这给视频编码技术带来了更大的机遇和挑战。在这样的背景下,AVS工作组率先组织制定新一代音视频编解码标准AVS3,目前第一阶段已经制定完成并发布了视频标准,第二阶段的增强档次也在制定的尾声。AVS3中集成了许多同时提高编码性能和计算复杂度的技术,导致编码时间大幅度提升。为了减少新技术对实时性的影响,本论文对AVS3中帧间帧内预测模式选择和块划分深度进行了大量研究,具体工作如下:1.提出了基于历史信息的LCU级预测模式判决快速算法。首先针对AVS3的编码器搭建了可视化平台,可以将编码结果快速生成大量参考价值高的可视图像,用来分析可视图像的LCU中所有CU的预测模式在时间和空间与图像内容的相关性。通过使用可视化平台,从中提取并定义了五种具有普适性的LCU级图像内容类型和历史类型判决参考。然后通过对典型的测试序列的编码结果进行数理统计,证明了历史类型判决参考和图像内容类型存在较强的相关性,可以使用历史类型判决参考作为确定图像内容类型的重要依据,进而跳过一些概率较小成为最佳预测模式的帧间帧内预测模式,达到减少计算量的目的。后续又从两个方面改进了算法模型,来减少性能损失和时间复杂度。一方面将历史类型判决参考以CU尺寸分为大块和小块历史类型判决参考,增加了预测的准确性;另一方面为时间相关性不高的特殊测试序列或者个别相关性较弱的帧设计快速算法。经过改进后的快速算法最后取得了不错的结果,在LDP模式下平均编码时间降低了 17.67%,亮度信号分量的BD-rate平均增加了 0.61%,具有一定的参考价值。2.本文对AVS3的块划分结构和流程进行研究,提出了基于历史信息的块划分快速算法。首先自定义了最大深度参考和最小深度参考,并对其和实际的划分深度使用典型的测试序列做了时间相关性实验,分析结果发现使用最大深度参考、最小深度参考预测的成功率分别为92.3%和95.2%,预测失败的平均的深度偏差也仅为1.07和1.01。而后又分析了最大深度参考对运动剧烈的LCU预测不准确的问题,二次改进了最大深度参考的定义,使预测成功率提高到98.5%。最后将设计的快速算法应用于参考代码上,在LDP模式下平均节省了 8.12%的编码时间,编码性能指标BD-rate平均损失了 0.26%。
其他文献
在金融业务中,存在大量如报销、核验等对表单票据进行识别的需求。传统的文字识别算法对图像质量要求很高,且识别精度较低,具有更高准确率和鲁棒性的深度学习算法成为近年来的发展趋势。目前基于深度学习的表单票据识别中尚存在若干难题:一是票据可能存在弯曲折叠的情况,导致文本行不平直,从而影响文字识别;二是财务报表中存在无边框表格,通用语义分割模型无法准确定位识别;三是印章中的弯曲文本识别存在较大困难。本文围绕
我国是农业大国,同时也是人口大国,农村人口占总人口数的近三分之二,乡村振兴作为全面建成小康社会坚定实施的重大战略之一,是以经济发展和文化发展为主路线的重要振兴策略.农业作为我国的第一产业,农业经济的发展在一定程度上决定了乡村振兴的实现.随着农业生产活动的日益增多,各种农业项目也越来越多,农业生产的范围越来越广泛.很显然,农业机械的应用能够有效地解放劳动力,提高农业生产效率,保障农业生产质量.尤其是农业机械自动化与智能化的推广与应用,是传统农业向现代化农业转型升级的重要标志,无论是在农业生产效率上、质量上,
由于农机数量多、范围广、传播方向广、安全隐患多、监控难度大,因此需要做好农机安全管理.本文本着以人为本、安全发展的方针,努力实现安全生产责任制,为农机安全管理提供一些参考建议.
当前,网络应用的实现架构正处于从集中式向分布式转变的进程中。随着各行业研究人员对区块链技术及其应用的不断探索,借助该技术搭建可信网络环境,构建新型信任体系,实施分布式系统的案例也越来越多。从供应链、数据共享、可信存证、工业产品溯源等场景当中的实践来看,基于区块链技术的应用仍然处在较为初级的阶段。在数字领域,解决数据易泄露、用户身份不可控、信息孤岛等问题,是推广分布式系统应用的出发点。移动自组网作为