感知音频编码的关键技术与改进

来源 :东南大学 | 被引量 : 0次 | 上传用户:WYQ1987412
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多媒体技术的应用需求促进了各种高质量数字音频压缩技术的快速发展。感知音频编码器以其压缩效率高、重建音频信号质量好的特点在多媒体应用领域得到广泛关注。由于人们对听觉原理的研究日渐深入以及对心理声学原理的充分利用,使得感知音频编码器越来越趋向感知上最优的编码效果,但引入的一个普遍现象是编码器结构的复杂化。因此,感知音频编码关键技术的研究具有重要的理论和应用价值。 本文的主要工作包括分析和研究了瞬态信号检测算法、前向掩蔽模型算法、心理声学模型算法、量化循环结构和熵编码,给出了改进的音频基础编码器(EAFC)的设计实例及其软件界面,并对EAFC进行了客观评价分析。主要贡献如下: 1)在感知音频编码中,需要对瞬态信号帧进行特殊处理,前提是合理地检测出瞬态信号。基于瞬态信号的时域和频域特点,本文提出一种利用信号平坦测度作为判决函数的时一频瞬态检测算法。与已有的瞬态检测技术相比,新算法在漏检和误检方面有所改善,且运算复杂度随着瞬态信号的明显程度自适应变化,具有检测准确度高、运算简单等优点。 2)对于心理声学模型算法,本文在研究心理声学原理和前向掩蔽模型基础上,充分利用人耳的时域掩蔽和频域掩蔽特性,将一种听觉前向掩蔽模型整合到传统的心理声学模型中,经过掩模间的掩蔽非线性叠加,建立了时一频域新的联合掩蔽平面。由此消除了更多的人耳感知无关冗余,可提高感知音频编码效率。 3)由于AAC编码器中量化模块所采用的迭代双循环结构存在一定缺陷,本文对其量化循环结构进行了改进:利用初始量化阶(SDI)减小循环次数;利用比特分配算法(BFOS)使得有限的编码位数发挥更佳的作用;结合两者优点设计了量化模块的单循环结构。此结构在一定程度上提高了编码效率和编码质量。 4)结合所研究的编码器各关键模块,设计了一个改进的音频编码器和解码器系统,在MFC基础类架构下实现了其软件界面;同时还研究了感知音频编码器编码质量的主观和客观评价方法,对改进的音频编码器重建信号进行了客观评价分析。
其他文献
HSUPA作为WCDMA上行系统的增强标准,能够提供更高的上行数据速率和更低的延时。在HSUPA中,新增了增强型专用物理数据信道(E-DPDCH),它允许采用扩频因子(SF)最小为2。由于多径衰
运动向量估计在编码过程中占运算量很大的部分,比重是50%以上。因此,为了提高编码器执行速度,最有效的方法是提高运动估计效率。目前用于计算运动向量的快速搜索法经常因为陷
下一代的无线蜂窝网络引入了无线中继节点。无线中继节点可以增大小区的覆盖范围或者增大小区容量,提高小区中用户的通信质量。移动台由一个基站或者中继节点的覆盖范围移动到
近年来,物联网技术飞速发展,物联网技术基础则是无线传感器网络。无线传感器网络推动中人与人,人与自然的信息交互。在某一方面实现了人与自然的进一步发展。随着近年来各种地质
在无线通信信道中传输高速率数据时,码间干扰被认为是降低误码性能的主要因素,增强型数据速率GSM演进(EDGE)技术有效地提高了通用分组无线服务(GPRS)的移动数据速率,在EDGEPlus
RS码是迄今为止发现的一类很好的线性纠错码,它的纠错能力强,特别在短的和中等码长下,其性能很接近于理论值,并且构造方便,编码简单,编译码设备也不太复杂。正是由于该码的超强纠错
多输入多输出(Multiple-Input Multiple-Output,MIMO)无线通信系统是指在无线通信系统中,发射端和接收端配置多个天线单元进行数据的发射和接收。MIMO无线通信系统的优点是在保
随着人们对宽带无线通信需求的不断增加,无线宽带通信向更高速率、更大的覆盖范围、更快的移动性方向发展。移动WiMAX(IEEE802.16e)凭借其先进的无线技术和IP网络架构,为人们提
射频识别(Radio Frequency Identification,RFID)技术使用射频信号在开放环境下对被标识物体实现无接触式自动识别,是物联网的关键技术。以识别精度高、抗干扰强、操作快捷方
H.264/AVC是ITU-T VCEG和ISO/IEC MPEG联合制定的最新国际视频编解码标准。由于H.264/AVC标准集中了近年来的一系列最新技术成果,在同等图像质量条件下其压缩率较以往标准提