论文部分内容阅读
网络技术的发展推动了多媒体技术的发展,近年不断涌现出全新的多媒体网络应用,比如网络电视、远程教育、网络视频电话和远程医疗,这些应用都可能会遇到媒体之间不同步的问题,而这一问题的最突出表现是音频和视频的不同步。
本文针对音视频不同步的问题提出了两种基于MPEG-4 AVC/H.264视频编码标准的音视频同步压缩算法。这两种算法均是基于MPEG-4 AVC/H.264 CAVLC,将音频信号作为隐藏信息嵌入到视频信号中,然后将嵌入了音频的视频码流压缩、存储和传送。这两种算法可以省去单独传送音频信号所需要的信道,降低硬件资源消耗。二者的不同之处在于,一种算法是基于拖尾系数的符号,另一种算法则是基于Zig-Zag扫描逆顺序上除拖尾系数之外的第一个非零系数的奇偶性。经过JM86Baseline模型验证,这两种算法均能实现将音频信号嵌入到视频信号而不会对视频信号质量造成明显的下降,而且从解码器提取的音频信号和原始音频信号几乎没有差别。
对于算法中所涉及到的硬件部分,本文采用可重构理论对其进行了硬件设计。首先,本文对CAVLC解码器中的各个模块分别进行了设计,对解码Coeff_Token的码表进行了优化,并提出了一种全新的Coeff_Token解码结构。然后,通过查找CAVLC解码器和MPEG-4 AVC/H.264标准定义的三种逆变换编码模式的可共用的部分,采用可重构理论对CAVLC解码器中的nC解码和这三种逆变换进行了设计,通过可重构单元同时实现nC解码、4×4逆整数变换、4×4逆Hadamard变换和2×2逆Hadamard变换。硬件设计通过Verilog HDL实现,并采用ModelSim、Synopsys Design Compiler、Xilinx Virtex-5 XC5VLX110T和Synopsys Astro分别进行了功能验证、综合与时序验证、FPGA验证实施和自动布局布线。仿真和验证结果表明,本文的设计能够满足设计要求,电路性能相对于参考设计有较大提高。
本文创新之处在于提出了两种全新的音视频同步压缩算法,采用可重构理论实现CAVLC解码器和逆变换模块电路。与传统的电路结构相比,本文的设计极大地提高了电路的灵活性,明显减少了芯片面积,而且满足实时解码1920×1080@30fps高清视频的需求。