视频编码器中帧间预测的算法优化和芯片设计

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户：cairaymond

【摘要】

：

二十世纪九十年代以来，数字视频压缩技术被广泛应用于通信、个人计算机、广播电视、消费电子等领域，堪称数字媒体产业的最核心技术之一。以MPEG-2为代表的信源编码标准获得了巨

【作者】

：

张力

【机构】

：

中国科学院计算技术研究所

【出处】

：

中国科学院计算技术研究所

【发表日期】

：

2008年期

【关键词】

：

视频编码器帧间预测芯片设计算法优化 AVS视频标准

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

二十世纪九十年代以来，数字视频压缩技术被广泛应用于通信、个人计算机、广播电视、消费电子等领域，堪称数字媒体产业的最核心技术之一。以MPEG-2为代表的信源编码标准获得了巨大的成功。进入新世纪以来，以H.264/AVC和AVS为代表的新一代信源编码标准出现了。AVS标准是我国具有自主知识产权的信源编码标准。2006年2月，AVS视频标准已经正式被批准为国家标准，进入了产业化推广的阶段。由于AVS视频标准的主要应用对象是标准清晰度/高清晰度电视，编码过程的计算复杂度较大，对编码器的优化设计提出了挑战。　　编码器优化中最为重要的一个问题就是帧间预测，帧问预测的主要目的是去除视频序列中的时域冗余，它是混合视频编码框架中对性能影响最为重要的一个环节，也是复杂度最高，耗费芯片面积和功耗最大的环节。特别是H.264和AVS标准中为了提高编码效率，引入了一系列的新技术：如1/4像素精度的运动估计，多模式预测，多帧参考和基于率失真优化的预测模式决策等等。这些都大大地提高了复杂度。　　本论文以帧间预测技术为研究对象，包括运动估计和预测模式决策两个方面，寻求编码效率，编码速度，硬件耗费三者之间的最优折衷点。本论文的工作包括算法优化和芯片结构设计两个方面。在具体标准的应用方面，着重于AVS编码器的优化设计。　　本文的主要内容包括以下五点：　　 1)基于计算量分配的复杂度可伸缩的运动估计算法：该方法利用以前的运动信息，先合理地分配计算资源给不同的宏块，然后每个宏块用复杂度渐进的方式使用所分得的计算量。这样运动估计过程能够与编码器的计算能力相匹配，在不超过编码器计算复杂度预算的条件下可以获得尽量好的编码性能。　　 2)针对AVS全搜索运动估计的算法与芯片结构联合设计：对运动矢量预测残差的概率分布进行数学建模，利用拉普拉斯分布的数学特性推导出全搜索窗口大小的上限，降低了复杂度并保持搜索精度。然后用阵列结构实现了全搜索方法，达成了高并行和全流水。　　 3)针对AVS整数/分数运动估计的可重用芯片结构：设计了一个可重用的芯片结构，该结构利用可配置的阵列来生成不同ME模式所需的参考像素，可以被整数/分数运动估计所复用，降低了芯片面积。该结构可以支持多种快速搜索模式和块类型，从而为实现复杂度可控的编码器提供了条件。计算资源的分配使得最重要的搜索模式和块类型得到最多的计算量，从而在实时约束下达到编码效率最高。　　 4)针对AVS率失真优化模式决策的芯片结构：率失真优化的模式决策对于编码器的性能影响较大且复杂度高，因此有用芯片实现的必要。本文针对AVS率失真优化的预测模式决策，设计了一个计算引擎，该结构进行像素级流水，可以完整的计算出各个预测模式所需的比特数和失真度。从而为模式决策提供信息。　　 5)针对AVS帧间预测的整体芯片结构：基于3)和4)的工作，设计了一个整体芯片结构。该结构由三级流水组成。该结构中使用了第3)点中所提出的可重用结构来完成ME。MD阶段则使用了两个第4)点中所提出的计算引擎，并合理地分配任务以满足实时性。由于使用了数据复用，使得访存带宽大大降低。片上缓冲区的合理组织可以实现各阶段的并行流水操作。该结构可以支持720P(1280×720)序列30帧每秒的帧间预测，并保持编码性能。　　总之，本论文研究了帧间预测的各个部分，最终设计出了一个优化的整体芯片结构来完成AVS的帧间预测，设计的主要思路是寻求编码耗费与编码性能之间的最优折衷点。

其他文献

复杂背景下手的检测、跟踪与识别

随着计算机技术的发展，传统的人机交互技术已难以适应越来越复杂多样的需求。用户要求更加自然和智能的交互方法，包括声音、视觉和智能传感器等等。其中基于计算机视觉的方法具

学位

人机手势交互粒子滤波主动形状模型计算机视觉虚拟现实高斯建模

可配置的WiMAX和TD-SCDMA双模终端基带芯片结构研究

近年来，WiMAX技术凭借包括Intel公司等在内的众多国际厂商的支持，发展十分迅速。2007年10月，WiMAX的TDD模式被国际电信联盟大会正式批准为第三代移动数字通信标准，为其在全世界范

学位

基带芯片第三代移动数字通信多模终端芯片星座图分析多时钟域策略时分同步码分多址

空间飞行器编队重构建模与规划方法研究

编队重构是实现空间飞行器编队飞行的一项关键技术，也是自动导航和控制的重要研究领域，无论在理论研究还是实际应用上都具有重大意义。本论文针对空间飞行器编队重构问题展开了

学位

空间飞行器编队飞行编队重构轨道规划协同规划多目标优化

基于呈现信息的手机应用的设计与实现

为解决何时通信、选择何种方式通信的问题，“呈现信息”应运而生。　　呈现信息表达的是用户进行通信的能力和意愿。通过呈现信息的协助，人们可以选择最恰当的时间、使用最合

学位

呈现信息手机应用多媒体技术视频共享

对等网络拓扑结构及其复杂查询研究

对等网络技术能够准确高效地提供精确匹配和多关键字查询等简单查询服务，是解决计算机网络中大规模信息资源共享的重要手段。然而随着网络规模的快速增长，拓扑结构多元化及用户

学位

对等网络拓扑结构路由算法复杂查询分布式索引语义链

面向虚拟机管理的机群高可用服务研究

机群是一组协同工作的独立计算节点的集合，作为一个整体对外提供计算资源和服务。大规模数据中心一直是机群应用的重要领域。随着社会信息化程度的不断提高，数据中心开始在商业

学位

机群操作系统资源利用可扩展性虚拟机

多形态CPU模拟

在计算机技术发展过程中，模拟一直是一个重要的工具。模拟器是运行在一个平台上的特殊程序，它模拟了另外一个平台所具有的特征。模拟器由于其灵活性，被广泛用于体系结构研究、系

学位

模拟器复杂应用程序性能评测软件移植CPU模拟单元回调函数

AVS视频解码的错误检测与隐藏技术研究

码流错误检测与恢复技术一直是数字信号在信道中传输的研究热点，围绕AVS视频解码容错系统方案，本论文的结构安排如下:　　第一章为绪论。　　第二章对视频编解码标准的发展

学位

视频解码码流错误检测容错系统隐藏技术

基于ASR文本的视频语义概念检测技术研究

视频是集图像、声音、文字等为一体的综合性媒体。随着互联网技术的发展和网络带宽的提升，网络视频数据量呈爆炸式增长，从浩瀚的视频数据库中检索感兴趣的资源，传统的基于关键词

学位

视频检索高层语义特征文本分类语义概念融合概念相关性自动语音识别

面向城市场景的信号覆盖快速计算系统研究

随着数据通信与多媒体业务需求的发展，研究城市场景室外信号传播特性，建立有实用意义的信号传播模型，能够为无线通信系统设计提供依据，从而提高和改善特定区域的信号覆盖能力。传

学位

城市场景信号覆盖电磁计算光柱跟踪算法网格剖分

视频编码器中帧间预测的算法优化和芯片设计

与本文相关的学术论文