基于H.264的快速视频转码关键技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:fbcpingqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展,多媒体通信已广泛渗透到社会生活的各个方面。由于网络种类的多样性,终端设备性能的差异,使得提高视频码流在不同应用环境之间的兼容性变得十分重要。转换编码是将多媒体内容的原始格式根据需要转换成目标格式的视频处理技术,为使视频流适应不同网络带宽、视频显示设备和支持不同标准的解码器提供了有效的解决方法,包括转换空间/时间分辨率、码率以及编码标准的视频转码。与此同时,作为未来有线和无线网络传输环境下的视频压缩标准,H.264.在压缩高效性和传输可靠性方面优于其它视频编码标准,在各领域中得到了广泛应用。因此,作为数字多媒体应用中的一项关键技术,基于H.264的视频转码成为近年来国内外研究的热点。理想的视频转码器应具有低运算复杂度,高转码质量等性能。然而,H.264编码标准中的帧间帧内预测以及运动估计在极大提高视频编码压缩率的同时也增加了编码器的计算复杂度,影响到算法的实时性。  本文研究的目标是在保证H.264.高效压缩性能的前提下,降低基于H.264视频转码器的运算复杂度,提高转码速度,促进其在实时业务中的应用。论文针对基于H.264降低空间分辨率和时间分辨率的转码技术展开研究,特别深入研究了视频转码中的三个关键技术:帧间模式选择、帧内模式选择、运动矢量合成及修正。完成的工作和取得的创新性成果包括:  第一,将支持向量机(Support Vector Machine,SVM)方法引入到视频转码技术中,提出了针对视频转码的快速SVM训练算法。首先分析了SVM原理,研究了SVM在快速视频转码中的应用技术。然后针对耗时的SVM训练过程,利用K-means算法缩减样本集,并通过K-NN算法检测边界点和噪声点,实现了提高SVM的训练速度和预测准确度的目的。  第二,针对降尺寸视频转码技术,首先在快速模式选择方面提出两种创新算法:基于SVM的快速帧内及帧间模式选择算法和基于感兴趣区域的帧间模式选择算法。算法一将SVM理论应用于降尺寸视频转码快速帧内及帧间预测方法中,针对SVM理论中的两个关键技术,特征向量及核函数的选取提出具体解决方法。算法二是基于视觉感知理论感兴趣区域划分概念提出的,利用宏块运动特征检测图像运动边缘,进而划分运动区域与背景区域,对不同区域内的宏块分配不同的帧间模式选择策略。然后,在运动矢量合成方面也提出了两种方法:基于宏块多样性和重要性的合成算法和基于4×4子块的AWW运动矢量合成方法。算法一是利用运动矢量的方差判断宏块运动的多样性,基于宏块的多样性和重要性自适应地重建和修正运动矢量。算法二是为了解决基于16×16宏块合成运动矢量方法的缺陷,提出基于4×4子块的方法,以此提高转码质量。  第三,研究了H.264跳帧转码技术,提出了基于SVM和宏块时域相关性的快速模式选择算法,和基于宏块运动特征的自适应运动矢量合成算法和运动搜索策略。根据目前已有算法存在的问题,针对不同运动剧烈程度的视频序列,结合SVM和宏块的时域相关性进行快速帧间模式选择。通过对宏块运动特征的分析,引入运动尺度因子,对缓慢变化和快速变化的视频采用不同运动矢量合成和修正算法。  通过仿真实验证明,本文提出的快速模式选择和运动矢量合成算法在保证了H.264的高压缩性能和转码后视频具有较高质量的前提下,有效降低了降尺寸转码和跳帧转码的运算复杂度。针对不同类型的视频都获得了较好的转码效果,与现有算法相比,具有更广泛的适用性和更强的鲁棒性。
其他文献
光呼吸是C3植物一个重要的生理过程,羟基丙酮酸还原酶(HPR)是光呼吸代谢途径中催化羟基丙酮酸还原成甘油酸的一个关键酶,其活性远高于该途径中的其他酶的活性。光呼吸途径中所
澜沧江姬鼠(Apodemus ilex)为小型啮齿类动物,长期以来常被认为是中华姬鼠(A.draco)或长尾姬鼠(A.orestes)的同物异名,但近年基于线粒体Cyt b的研究证明,该类群与中华姬鼠的
学位
近年来,我国人民的思想水平在经济的发展过程中不断的提高,逐渐加强对学生的教育的关注,要求学生在学习中不仅可以提高自身的学习成绩还要在一定程度上提高自身思想水平,以此
Backgrounds Type Ⅰ interferonopathy is a group of autoinflammatory disorders associated with prominent enhanced type Ⅰ interferon signaling.The mechanisms are
写作是语文教学的基本内容,也是考察学生语文能力的一个重要方面,老师除了要下大力气全面提高学生的语文素养之余,也应当适当地对学生进行考试作文的技巧训练,从主题提炼,创
Background Fibrodysplasia ossificans progressiva (FOP) is a rare and disabling heritable connective tissue disease that is difficult to treat.This study seeks t
康德对审美的考察是从鉴赏力的概念入手的,由鉴赏力到反思性判断力,最终到情感.在康德看来,审美鉴赏力是一种完全感性的能力,是按照质、量、关系、模态四大类范畴,从四大类范
本文综合阐述了植物酚类物质的化学结构及其防御作用。通过分析额济纳胡杨林自然保护区中虫害以及人工落叶实验对胡杨叶片中酚类物质含量的影响,考察了极端干旱地区胡杨酚类
由于在光电子器件、功率电子器件、高频微波器件等方面的巨大应用价值,以GaN为代表的Ⅲ族氮化物受到广泛的关注。和传统半导体不同的是氮化物半导体的产业应用走在基础研究之
合成孔径激光雷达(SAL)作为合成孔径雷达(SAR)在光波波段的类推,具有成像速度快,分辨率高的优点,这也吸引了众多学者的研究兴趣。但是,在其工程化的道路上也存在许多SAR中所