低延迟高质量音频编码算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lsh01015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一般认为,高效的感知音频编码与以实时通信为目的的低延迟编码是两个不同的研究和应用领域。一方面,感知音频编码在较宽的频带范围内,能够以极低的码率提供主观音质极好的音频,但编解码延迟较大,不适合交互式的实时通信的应用;另一方面,语音编码能够满足实时通信延迟的要求,但对于非语音信号,其编码性能较差。因此,研究同时具有高质量和低延迟的音频编码技术非常必要。本文提出了一种新的低延迟高质量音频编码算LDX,主要面向交互式的实时通信。为了降低编解码算法延迟,LDX并未完全沿袭传统的感知音频编码的技术路线,而是采用了相对较短、长度固定的变换窗,从而大幅度地降低了算法延迟。同时,为了在高压缩比下获得高质量的音频,LDX对现有的心理声学模型和立体声编码算法作了改进,运用FFT和MDCT相结合的心理声学分析方法,不仅降低了算法复杂度,同时也提高了心理声学分析的精确度;LDX运用正方形极坐标映射的声道耦合算法,相对于传统的M/S立体声编码算法,具有更高的编码效率;针对变换的音频编码中预回声现象,LDX提出了一种时域拆分——频域合成的、基于组合心理声学模型的预回声处理新算法,能有效地抑制预回声,从而保证了音频质量。因此,LDX具有以下性能特性:在相同编码比特率下,音质要远好于ITU-T G.722.1c和MP3;算法延迟低,16kHz、32kHz和48kHz采样率下最小算法延迟分别为16ms、8ms和5.33ms,能够满足交互式的实时通信;支持较大范围的编码比特率和采样率;中等算法复杂度。总之,LDX算法的提出弥补了传统音频编码算法和语音编码算法的不足,它不仅具有较低的编解码算法延迟,而且在编码效率、音质和算法复杂度等方面,可以与时下的其它高级感知音频编码算法相媲美。
其他文献
期刊
期刊
无线传感器网络(Wireless Sensor Networks,WSN)广泛应用于军事、国家安全、反恐抗灾、环境监测、交通管理、医疗卫生、制造业等领域。随着WSN研究的深入和应用,安全问题引起
目前,软件无线电技术已成为无线电通信领域的技术热点,在国内外引起了广泛的重视。纵观无线通信的发展史,无线通信系统已经经历了从模拟到数字的发展历程,正朝着软件无线电的
近年来VoIP和WLAN的应用非常广泛,通过以太网本身提供电力支持的需求也越来越迫切,以太网远程供电(PoE)技术以其对数据和电源一举两得的传输方式得到了迅速推广,PoE技术正被
中国移动通信迅速发展,移动用户对通信业务的种类和质量的要求不断提高,我国从 2005 年开始陆续开始建设 3G 移动通信网络。国外的WCDMA 和 CDMA2000 都有成熟的用于实验、建网
期刊
高速网络监控是保障高速网络安全的基本措施之一。在网络拓扑中的关键位置对数据报文进行更详细的分析和监控,可以减少和杜绝由互联网技术所带来的网络内容安全问题。该系统
期刊
期刊