可伸缩视频编码并行方法研究与应用

来源 :北京大学 | 被引量 : 0次 | 上传用户：zhiming2692

【摘要】

：

近些年来，视频编码技术得到了迅速发展，视频压缩效率的不断提高使视频编码技术得到了广泛应用，主要包括数字电视、IPTV和网络视频等。H264/AVC、AVS以及可伸缩视频编码(SVC：Scala

【作者】

：

姚凯

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2011年期

【关键词】

：

可伸缩视频编码并行编码任务调度复杂度估计

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近些年来，视频编码技术得到了迅速发展，视频压缩效率的不断提高使视频编码技术得到了广泛应用，主要包括数字电视、IPTV和网络视频等。H264/AVC、AVS以及可伸缩视频编码(SVC：Scalable Video Coding)等编码标准的相继提出，使得编码效率和编码灵活性有了很大程度的提高。尤其是SVC编码标准的提出，很好地适应了网络异构性强的环境，使数字视频的应用领域变得更加广泛。但由于SVC编码方法需要支持各方面的可扩展性，使它在编码过程中具有相当高的编码复杂度，这就对该编码方法的实际应用造成了很大障碍。因此，需要寻找一些方法来提高它的编码速度，使它更好地得到应用。随着硬件技术的发展，提高处理器速度的主流方法已经从以前提高单核处理器主频的策略转向了提高并行计算能力的策略。现在多核多线程技术已经被广泛地应用在各种计算复杂度较高的处理环境中，因此SVC编码方法和并行处理的结合将是一个非常有效的加速方法。　　本文提出了一个视频并行编码框架，主要由五个模块构成，它们分别是：并行策略模块(Parallel Strategy Module)，复杂度估计模块(Complexity Estimation Module)，无回路有向图模块(DAG Module)，启发式调度模块(Heuristics Scheduling Module)和编码模块(Encoding Module)。　　针对SVC的并行编码，本文在并行策略模块中，分别通过SVC的时间可伸缩特性和质量可伸缩特性来设计并行编码策略。通过利用时间可伸缩特性，位于同一时间层的视频帧之间是相互独立的，因此它们可以同时进行编码。此外，由于相邻GOP(Group of Pictures)之间只有关键帧之间相关联，当前一个GOP的关键帧编码结束后，下一个GOP的关键帧和上一个GOP的B帧就可以同时开始编码。这样在一个时间层上就有更多视频帧可以同时编码，很大程度地提高了编码并行度。由于在SVC的中等质量可伸缩特性(MGS：Medium Gain Scalability)中，关键帧在编码过程中只参考前一关键帧的基本层，而其他视频帧参考最高质量层。因此，只需前一个关键帧的基本层编码结束后，当前关键帧就可以开始编码，这样视频帧能够更快地开始编码。进一步地，更多的B帧也能够更早的开始编码，更大程度地提高了编码并行度。　　在复杂度估计模块，本文以GOP为单位，对视频帧的编码复杂度进行估计。在估计过程中，本文结合最小二乘法和具有最优自回归性质的卡尔曼滤波器来对编码复杂度进行估计。采用这种方法对视频帧的编码复杂度进行了比较准确的估计，并且从最后利用编码复杂度来对并行编码任务进行调度的实验结果也可以得出：该方法可以准确地对并行编码任务编码复杂度进行估计，并且根据编码复杂度来对任务调度可以取得很高的编码加速比。　　为了能够更好地对SVC编码任务进行调度，本文采用无回路有向图(DAG：Directed Acyclic Graph)来对SVC并行编码任务进行描述，结合前面对任务复杂度估计的信息，无回路有向图不仅能够很好地对编码任务的信息进行描述，同时很好对任务之间的相互联系进行建模。基于DAG模块中对SVC并行编码的建模，在本文中提出了两种优先级选择方法：一种是根据视频帧的显示顺序进行编码；另外一种是根据视频帧的编码复杂度进行编码。通过这两种调度算法，SVC并行编码可以取得很高的编码加速比，进而能够更好地满足高清实时编码的要求，使得SVC编码器应用到更多的应用场合中。　　最后，本文对SVC并行编码器的相关应用进行了简单介绍，通过利用SVC并行编码方法，很大程度地减少了编码的时间开销。这样就能够将SVC编码应用到编码实时性要求较高的直播系统中，很好地满足异构性和带宽抖动大的网络环境。并且通过SVC编码的灵活性，使得SVC点播系统更好地满足终端用户需求。

其他文献

软件实现的控制流容错技术研究

随着世界各国在空间探测领域内的深入研究和扩展实验，空间探测领域使用的计算机系统所需完成的任务越来越复杂。但在空间环境中，由于空间辐射的影响，计算机系统很容易发生硬件故

学位

计算机系统容错技术控制流检测软件设计

EMA数据驱动的汉语动态发音模拟的研究

具有真实感的语音可视化合成技术一直是多媒体和人机交互领域的一个有趣而具有挑战性的研究方向。它可以广泛地应用于教学、数字娱乐、远程会议以及电影游戏等方面。　　本

学位

可视语音合成EMA数据协同发音三维虚拟人头语音动画

面向关系数据库的语义关键字搜索研究

基于关键字的搜索引擎是人们在互联网上搜索信息的重要方式,而互联网上大量的关系数据库则构成了DeepWeb的主要组成部分,因此面向关系数据库的关键字搜索成为该领域学者关注

学位

关系数据库关键字语义SKS

社交网络用户交互行为分析研究

近年来在线社交网络(Online Social Network，简称OSN)飞速发展，用户数量不断增加。在线社交网络以用户为中心，每个用户和网络中的其他用户成为朋友，形成人际关系网络，用户之间通过

学位

社交网络隐马尔科夫模型用户交互行为弱权关键边信息传播

体绘制中的传递函数与剥离算法研究

近年来，随着各种数据获取技术与影像技术的逐渐成熟，三维标量场可视化技术已经成为科学计算可视化领域中的研究热点。体绘制作为一种重要的三维标量场可视化技术，在科学计算、医

学位

体绘制方向性可视化传递函数重要性驱动梯度剥离医学体数据

基于运动捕获数据的人体运动合成

数据驱动的人体动画合成采用捕获的真实人体运动数据驱动虚拟人体模型来产生动画，该方法由于动画制作效率高，所得结果真实感强，在近年来得到了广泛应用。但是由于运动捕获数据只

学位

运动捕获数据关键帧提取运动数据检索人体运动合成重建误差编码匹配算法

基于交互式的鸟类图像识别系统的研究与实现

物种的鉴别与分类是生物学等科学领域中一项较为常见的科学研究内容。传统的基因鉴别、形态学鉴别等物种鉴别方法都需要专业的数据库支持，并且需要专业人员对样本的基因、形态

学位

鸟类鉴别图像识别人机交互特征提取数据库多维索引

UGC视频系统中社会网络关联性研究

随着web2.0技术的产生和发展，用户产生的内容(User-Generated Content，UGC)成为互联网中资源的重要来源之一。YouTube、YouKu等UGC视频系统近年来取得了重大的成功。YouKu，作为

学位

UGC视频系统社会连接语义相关好友推荐

蛋白质结构预测的穿线法研究

蛋白质功能是由其三维结构决定的，因此研究蛋白质的功能的前提是深入了解它的结构。实验测定结构昂贵的花费，加上高通量测序技术的驱动，使得预测方法的地位愈显重要。蛋白质结构

学位

序列分析统计模型蛋白质结构预测穿线法能量函数局部搜索

野外车辆定位监控系统通信中间件技术研究

野外车辆定位监控系统作为车辆自组网的重要应用系统，正面临着车辆组网结构灵活化，系统功能丰富化和通信手段多样化等新挑战。军警、勘探等行业的野外车辆具有分级编组特点，车辆

学位

移动通信自组织网络节点定位网络架构

可伸缩视频编码并行方法研究与应用

与本文相关的学术论文