视频图像时域冗余统计模型研究及其应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hongniba3493
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频图像数据维度高、流量大、传输带宽受限,尤其在5G时代下,对高效高性能的编码提出了挑战。如何提升高清视频编码过程中图像的传输质量并确保高效压缩效率,如何尽可能地通过率-失真优化技术平衡码率与失真从而抉择更好的预测模式获得更好的编码性能,都是视频编码研究的关键问题。在问题驱动下,本文分析并建立了时域冗余模型,分别给出了图像级、块级的率-失真优化策略。具体工作分为三个方面。(1)针对编码中占比最大的时域冗余,提出并建立了时域冗余模型,用于预测未编码块的信息熵。统计并分析了基准测试序列编码产生的比特信息熵。对信源图像进行了运动矢量和残差分解计算,获得了每个编码块的预测复杂度信息,建立了块的信息熵与复杂度之间的线性映射。分别提出了块级和图像级的时域冗余模型,LTDR-Model和PTDR-Model,用于编码前图像信息熵大小的预测,为比特重分配和率-失真优化调节提供模型基础。(2)时域分层参考结构下,提出了图像级的编码参数调节算法。根据不同时域层图像的参考关系和参考概率,分析图像组内图像的参考价值和预测信息熵以综合获得参考能量因子。联立能量因子与层级价值调节参考图像的拉格朗日乘子,同时反馈更新对应的量化参数。在随机存取结构下,测试结果与AVS3参考软件HPM通测配置基线相比,平均获得了 0.61%的BDBR性能提升,最高可获得2.03%的 BDBR 增益。(3)根据时域邻近编码比特强相关属性,实现块级编码优化参数的自适应调节。采集图像块的失真和码率,分析发现时域相邻块之间存在马尔科夫性质。进一步通过时域邻近块导出当前块码率和图像平均码率,旨在寻求当前块更优的比特分配。采用R-Q率-失真模型实现为每一个最大编码块分配最佳的拉格朗日乘子。在AVS3标准下,低延迟结构的实验结果与基准配置相比BDBR性能平均提升了 0.25%,最高可获得0.94%的BDBR增益。三个方面的研究工作,为AVS3标准贡献了一系列的视频编码优化技术,取得了主客观图像质量的提升,显著增进了最新中国音视频标准的整体性能。相关工作已经向AVS工作组提交了视频技术提案。
其他文献
近年来,随着互联网大数据的发展,各种形式的多媒体数据(图像、文本、视频、音频等)呈现出爆炸式的增长。而对大规模多媒体数据精准、有效的检索也随之成为一个新的研究热点和难点。多媒体检索的任务目标是实现以一种数据类型作为查询来检索得到本类型或其他类型的相关数据。例如,用户可以使用文本检索相关的图片或视频。本文针对大规模多媒体检索的重点和难点问题进行研究,深入探索了大规模多媒体检索已有方法存在的一些问题及
在深度学习领域,视觉问答一直是热门的研究方向,这一任务的定义如下:一个视觉问答系统涉及视觉和文本的处理。由自然图像和形式自由、开放式的自然语言问题作为输入,以生成一条自然语言答案作为输出。目前的视觉问答方法通常基于物体检测的模型,计算速度慢且缺乏可解释性。并且训练依赖大量样本缺乏少样本学习能力。在本文中通过使用纯Transformer结构或卷积与Transformer相结合的方式对图像特征进行提取
主流的软件开发模式从瀑布模型一直演进到敏捷开发方法,即从面向文档的线性开发模式转变成面向用户的迭代开发模式,是为了提高软件产品的交付效率。但更快的软件迭代速度加剧了开发团队与运维团队之间的隔阂,使得交付软件的质量下降。DevOps思想在此种背景下被提出,它提倡通过开发与运维团队之间的紧密协作来保证高速率地交付可靠软件,通过促进团队成员之间进行知识分享来加强成员之间的交流联系,但企业在实践DevOp
交通预测是智能交通系统领域中的一个经典方向和研究热点,它有助于交通控制、路线规划、车辆调度等任务,对于缓解交通拥堵以及保障公共交通安全具有重大的作用。影响交通预测的主要因素包括道路网络结构的空间相关性和路况非线性动态变化的时间依赖性。最近的工作将各种深度学习方法应用于交通预测,主要利用图神经网络进行空间相关性建模,利用循环神经网络进行时间依赖性建模。然而,大多数现有方法假设空间相关性是静态的,时间
数据稀疏、知识不完备等问题是制约知识图谱发展的重要因素,因此,完善知识图谱的知识补全算法是领域内的研究热点。现有的知识补全算法无法有效利用知识图谱内知识,以及对开放世界和知识包含的时间信息的忽视导致知识图谱中的知识存在失效情况,无法为基于知识图谱的问答系统提供可靠的知识支持。针对上述问题,本文展开对面向文本问答的开放世界知识补全技术的研究。通过构建面向开放世界的知识动态融合模型,引入开放世界知识补
目前正在研发的VVC、AV1、AVS3等新一代编码标准提高编码效率的手段主要是通过更多模式或更复杂的变换来提高压缩效率。本质上是在用巨大的时间复杂度换取有限的空间复杂度。本文则从主观视觉质量的角度探寻提高编码效率的可能性。传统视频编码技术一直使用客观评价指标作为失真衡量方法,仍然难以代替人眼主观效果评判。本文以基于主观效果的视频编码优化技术为研究主题,重点研究人眼主观感受指标的建模。进一步使用主观
近年来物联网迅速发展,物联网终端规模迅速扩大。然而对大量物联网终端的电池进行更换,需要高昂的维护成本。因而终端的功耗成为限制物联网长期大规模部署的主要因素之一。终端功耗居高不下的原因在于通信与计算的功耗。为降低物联网终端功耗,近几十年来出现了环境反向散射通信技术已经能将终端的通信功耗从mW级降至以W级。其中Wi-Fi反向散射通信系统,因可以借助现有Wi-Fi设备部署,具有易部署的优点。然而现有的W
近年来物联网取得了快速的发展,如何为大量的物联网设备供能成为了当今物联网领域急需解决的关键问题之一。由于具有体积小,寿命长,免维护的优势,使用环境能量采集技术的无源系统在物联网中得到广泛应用。但是,由于能量短缺以及能量采集功率与计算功率不匹配的原因,无源计算系统目前在实际应用中仍然受到较高的任务响应时间的困扰。如果能够进行合理改造使其满足实时计算对于响应时间的要求,无源系统就可以快速响应网关,获得
近年来,随着人工智能技术的飞速发展与我国人口老龄化进程的加快,机器人已经逐渐被应用于各个领域,尤其是一些从事简单工作的劳动力行业。房屋装修作为房地产相关服务的重要组成部分,装修质量和周期至关重要。同时,随着生活质量的高和国家对未来绿色建筑的倡导,人们对房屋装修的要求越来越高。在此背景下我国房屋装修行业逐渐向机械化、专业化、智能化方向转变。随着数据获取技术的发展,语义分割对象已经由二维图像转向体素、
作为区块链2.0时代的重要标志,智能合约具有数据透明、不可篡改、永久运行等特点,这就使得其在解决“信用”问题方面具有天然的优势,近几年来智能合约的数量和规模也在不断扩大,并且功能也日益复杂。但因智能合约的编写和传统软件的编写存在一定的相似性,所以智能合约也不可避免地存在漏洞。智能合约很容易遭到黑客攻击,因为它们很难修补,并且缺乏确保其质量的评估标准,黑客可以在以太坊上发布智能合约中的漏洞,几年前的