论文部分内容阅读
随着网络技术的飞速发展,多媒体通信已广泛渗透到社会生活的各个方面。由于网络种类的多样性,终端设备性能的差异,使得提高视频码流在不同应用环境之间的兼容性变得十分重要。转换编码是将多媒体内容的原始格式根据需要转换成目标格式的视频处理技术,为使视频流适应不同网络带宽、视频显示设备和支持不同标准的解码器提供了有效的解决方法,包括转换空间/时间分辨率、码率以及编码标准的视频转码。与此同时,作为未来有线和无线网络传输环境下的视频压缩标准,H.264.在压缩高效性和传输可靠性方面优于其它视频编码标准,在各领域中得到了广泛应用。因此,作为数字多媒体应用中的一项关键技术,基于H.264的视频转码成为近年来国内外研究的热点。理想的视频转码器应具有低运算复杂度,高转码质量等性能。然而,H.264编码标准中的帧间帧内预测以及运动估计在极大提高视频编码压缩率的同时也增加了编码器的计算复杂度,影响到算法的实时性。 本文研究的目标是在保证H.264.高效压缩性能的前提下,降低基于H.264视频转码器的运算复杂度,提高转码速度,促进其在实时业务中的应用。论文针对基于H.264降低空间分辨率和时间分辨率的转码技术展开研究,特别深入研究了视频转码中的三个关键技术:帧间模式选择、帧内模式选择、运动矢量合成及修正。完成的工作和取得的创新性成果包括: 第一,将支持向量机(Support Vector Machine,SVM)方法引入到视频转码技术中,提出了针对视频转码的快速SVM训练算法。首先分析了SVM原理,研究了SVM在快速视频转码中的应用技术。然后针对耗时的SVM训练过程,利用K-means算法缩减样本集,并通过K-NN算法检测边界点和噪声点,实现了提高SVM的训练速度和预测准确度的目的。 第二,针对降尺寸视频转码技术,首先在快速模式选择方面提出两种创新算法:基于SVM的快速帧内及帧间模式选择算法和基于感兴趣区域的帧间模式选择算法。算法一将SVM理论应用于降尺寸视频转码快速帧内及帧间预测方法中,针对SVM理论中的两个关键技术,特征向量及核函数的选取提出具体解决方法。算法二是基于视觉感知理论感兴趣区域划分概念提出的,利用宏块运动特征检测图像运动边缘,进而划分运动区域与背景区域,对不同区域内的宏块分配不同的帧间模式选择策略。然后,在运动矢量合成方面也提出了两种方法:基于宏块多样性和重要性的合成算法和基于4×4子块的AWW运动矢量合成方法。算法一是利用运动矢量的方差判断宏块运动的多样性,基于宏块的多样性和重要性自适应地重建和修正运动矢量。算法二是为了解决基于16×16宏块合成运动矢量方法的缺陷,提出基于4×4子块的方法,以此提高转码质量。 第三,研究了H.264跳帧转码技术,提出了基于SVM和宏块时域相关性的快速模式选择算法,和基于宏块运动特征的自适应运动矢量合成算法和运动搜索策略。根据目前已有算法存在的问题,针对不同运动剧烈程度的视频序列,结合SVM和宏块的时域相关性进行快速帧间模式选择。通过对宏块运动特征的分析,引入运动尺度因子,对缓慢变化和快速变化的视频采用不同运动矢量合成和修正算法。 通过仿真实验证明,本文提出的快速模式选择和运动矢量合成算法在保证了H.264的高压缩性能和转码后视频具有较高质量的前提下,有效降低了降尺寸转码和跳帧转码的运算复杂度。针对不同类型的视频都获得了较好的转码效果,与现有算法相比,具有更广泛的适用性和更强的鲁棒性。