论文部分内容阅读
环绕声MP3能让你真正融入乐池,身临其境,而不再仅仅是一个听众。
从某种程度上来说,不管是在电影院还是家里的客厅,环绕声都是完美音效体验的代名词。现在,无论你使用的是传统的DVD播放器或是PC,都能买到符合自己经济能力的音响系统。不过遗憾的是,为数众多的MP3爱好者却因为音频文件本身的限制,将这种令人愉悦的享受方式拒之门外。好消息是,最近德国Erlangen的Fraunhofer Institute研究出一种称为Spartial audio coding的编码方式,能让MP3文件在低比特率下实现环绕音效。
实现过程的关键是,在MP3编码过程中,将环绕声信息与传统的立体声信号一起嵌入MP3 的数据流中,以便让MP3文件能够向后兼容——那些老版的MP3播放器可以播放文件,支持多声道的播放器也可以使用文件中嵌入的环绕声数据。
多声道音效
为了制造出多声道信息,相关研究人员采用了Agere开发的BCC(binaural cue coding,心理声学编码)技术,使用多个麦克风同时录制多个独立音轨,以便创造出超越普通立体声空间印象的录音效果。
BCC使用了一个用于控制音频源的编码器以减少数据量,然后通过缩混技术将信号添加至一个汇总的双声道输出信号中,此法能将数据量减少80%左右。为了实现有空间感的音效,所有声道音频信号的差异数据首先被计算出来,然后再使用BCC编码器将它们组合成另一个环绕声声道信号。该环绕声道中包含各音频声道之间的时间和音量差异,以及各独立音源之间的相位关系。这个额外信息会被标记在MP3比特流中,以便系统通过MP3环绕声解码器识别。
Fraunhofer Institute的专家们在计算最终输出信号时,通过使用一种心理声学编码方式的立体声信号替代了原有的单声道输出信号,不过真正巧妙的地方在于保存在立体声信号中的空间信息,当BCC读取信号时,该信息在整个缩混过程中都不会被修改,而能够被输出立体声信号完整地保存下来。这避免了BCC编码输出的冗余,并且保证了在使用非环绕声MP3解码器播放文件时仍能够保留环绕声信息。
这个过程的优势有二:第一,比起单声道信号来,双声道信号能给人更为优越的空间印象;第二,即便是用没有环绕声功能的老式MP3解码器播放音频文件,双声道的音响系统所能提供的音效也要出色得多。
心理声学编码(Psychoacoustic coding)
在缩混完成之后,剩余的过程便和普通的MP3编码差异不大了。Fraunhofer MP3算法降低了立体声和环绕声信号的比特率,并使MP3文件的向后兼容性提高,现有的MP3解码器能够播放。
MP3所使用的数据压缩技术基于“感知声音编码(perceptual audio coding)”原理,即在对一段音乐进行编码时,将人耳无法识别或感知的频率都忽略掉,同时还对频率和音量进行分析,进一步将因为交迭而无法被人耳感知的频率过滤。
关于比特率
用户指定比特率对剩余的频率进行编码,比特率从32Kbits/sec到320Kbites/sec不等。如果你选择了浮动比特率(VBR),数据速率便会进行自动动态调整。这样能保证在低数据速率下产生最佳的声音质量。
即便将技术发挥到极致,MP3环绕声的成败与否最终还是在于它的音质。目前试验的MP3环绕声SAC编码最大的恒定比特率为192Kbits/sec,但根据Fraunhofer Institute的说法,最终的SAC编码应该使用浮动比特率,最高能达到320Kbits/sec。这其中包括记录空间信息的额外信号,大概会占到15至20Kbits/sec,这个数量在最终版本中会有适当的降低。
为什么要使用新标准?
也许有的人会问,为何不使用现有的Dolby Digital或DTS等环绕声技术呢?原因很简单,对于使用MP3 作为音源并希望嵌入环绕声信息,而音源又被低比特率所限的用户来说,他们需要一个新的标准。诸如音乐门户网站、Internet广播、在线音乐、游戏声音等方面的应用都会遇到上述问题。
一个实际应用的例子是,最近一家德国的老牌广播电台采用DAB数字音乐广播信号进行5.1环绕声信号的广播,环绕声信息只额外占用了大概16Kbits/sec的带宽。对于带宽紧张的应用环境来说,这无疑是个好消息。普通的DAB接收器则会忽略广播中的环绕声信息,而只提供普通的立体声音效。
Fraunhofer Institute正在寻找更多支持这个标准的许可证书,以便让这个技术能得到更广泛的推广。对DVD制造商来说,这同时也是一个商业契机。目前,由于这项技术要借助于软件编码器,因此整个应用程序还局限在PC平台上。专家预计在2005年会推出一个实时SAC编码器,而它的出现同时也会吸引广播公司的注意。
鉴于MP3在世界范围内的PC及独立播放器上拥有很高的使用频率和广泛的认可度,这项新标准推广的前景也颇为乐观。
不过,人们最为关心的还是它最终所能达到的音效。Fraunhofer在其网站的技术页面(www.iis.fraunhofer.de/amm/download/introduction_to_mp3surround.pdf)透露了一个关于MP3环绕声编码文件的盲听测试结果,结果表明其音质在一定程度上来说甚至和Dolby Prologic II系统不相上下,但是除非出现更多的音乐内容,这一格式很难让人完全认可它的质量。
影院课题
除了MP3环绕声,Fraunhofer Institute的专家们也进行着另一个音场再现系统的研究,这项研究成果将主要被用于影院和音乐厅。
这种系统被命名为Iosono,最近刚刚推出就已经引起了好莱坞的兴趣。Iosono是一个基于声波合成音场再现(WFS,wave field synthesis)的声音系统。WFS利用一个环形的音箱阵列完全真实地表现出现场的声音效果。该声音系统从某种程度上来说,相当于视觉上的全息摄影技术,因此也有人将其称为“全息音效技术”。
能够使用这种系统的环境自然也少不了一笔投资:试听室要被连续的音箱面板包围着,每个面板都包括8个双单元扬声器和16个数字放大器。考虑到每个独立的试听室中的声属性,这个室内音效的测量都由一组麦克风完成,而这些麦克风同样是系统的一部分。每个音箱的声音参数都由麦克风的测量结果而定,以用来真实还原源音频文件中的场景。用于处理信息和控制整个过程的PC数量将由试听室的大小和音箱的数量决定。
为了演示声波合成音场的音效,位于Ilmenau的Fraunhofer Institute的数字媒体技术中心使用一个电影院的观众席来布置整个Iosono系统。不过,和普通影院不同的是,这里的最佳听音位置并不局限于某个区域,而是扩展到了所有座位。
从技术层面来说,将Iosono技术应用于家庭影院以消除Dolby Digital或DTS对最佳听音位置的限制也是可行的,但由于Iosono系统需要动用大量音箱以形成环形音箱阵列,很难想象如此大的开销如何能被大众所接受。由此看来,这种系统的最佳归宿还是影院和音乐厅这样的商业应用环境。(编/cli)
MP3环绕声
MP3环绕声编码器可以将多声道文件转换成MP3格式。
MP3环绕声文件同时能够兼容所有的MP3解码器,并可以被重新创建为立体声效。
与其它的环绕声技术相比,这种环绕声文件的比特率要低得多。
延伸阅读
● www.fraunhofer.de Fraunhofer的主页
● www.dolby.com Dolby实验室的主页
● www.dtsonline.com DTS的主页
● www.idmt.fhg.de Fraunhofer Institute数字媒体技术中心主页
● www.iosono-sound.com Iosono空间技术主页