论文部分内容阅读
近年来,多媒体技术的应用需求促进了各种高质量数字音频压缩技术的快速发展。感知音频编码器以其压缩效率高、重建音频信号质量好的特点在多媒体应用领域得到广泛关注。由于人们对听觉原理的研究日渐深入以及对心理声学原理的充分利用,使得感知音频编码器越来越趋向感知上最优的编码效果,但引入的一个普遍现象是编码器结构的复杂化。因此,感知音频编码关键技术的研究具有重要的理论和应用价值。
本文的主要工作包括分析和研究了瞬态信号检测算法、前向掩蔽模型算法、心理声学模型算法、量化循环结构和熵编码,给出了改进的音频基础编码器(EAFC)的设计实例及其软件界面,并对EAFC进行了客观评价分析。主要贡献如下:
1)在感知音频编码中,需要对瞬态信号帧进行特殊处理,前提是合理地检测出瞬态信号。基于瞬态信号的时域和频域特点,本文提出一种利用信号平坦测度作为判决函数的时一频瞬态检测算法。与已有的瞬态检测技术相比,新算法在漏检和误检方面有所改善,且运算复杂度随着瞬态信号的明显程度自适应变化,具有检测准确度高、运算简单等优点。
2)对于心理声学模型算法,本文在研究心理声学原理和前向掩蔽模型基础上,充分利用人耳的时域掩蔽和频域掩蔽特性,将一种听觉前向掩蔽模型整合到传统的心理声学模型中,经过掩模间的掩蔽非线性叠加,建立了时一频域新的联合掩蔽平面。由此消除了更多的人耳感知无关冗余,可提高感知音频编码效率。
3)由于AAC编码器中量化模块所采用的迭代双循环结构存在一定缺陷,本文对其量化循环结构进行了改进:利用初始量化阶(SDI)减小循环次数;利用比特分配算法(BFOS)使得有限的编码位数发挥更佳的作用;结合两者优点设计了量化模块的单循环结构。此结构在一定程度上提高了编码效率和编码质量。
4)结合所研究的编码器各关键模块,设计了一个改进的音频编码器和解码器系统,在MFC基础类架构下实现了其软件界面;同时还研究了感知音频编码器编码质量的主观和客观评价方法,对改进的音频编码器重建信号进行了客观评价分析。