论文部分内容阅读
【摘要】 本文简析EBU R.128各响度单位的意义,响度控制应该达到的目标,以及播控中心响度控制的方法。
【关键词】响度电平 K计权 算法 响度范围 真实峰值电平 响度控制
电视播出的目的,是将节目安全、优质地呈现在观众面前。然而,伴随节目切换而发生的电视音量突跳(响度问题),一直困扰观众。造成响度问题的重要原因是缺少合适的客观指标。为此,ITU制订了BS.1770系列标准,推荐了一种基于RLB加权的响度算法。
EBU PLOUD小组以ITU标准为基础,制订了EBU R.128建议书,对响度的被测主体、积分窗长等细节作了更加明确的定义,其配套的Tech 3341、3342、3343、3344文档,详细介绍了EBU制式(EBU Mode)响度单位的定义与测量、响度控制,以及制作、传输等环节应当注意的事项,对电视台解决响度问题及音频的安全播出具有重要的指导意义。本文介绍的是EBU最新修订的R.128-2011。
一.响度单位的定义与测量
EBU R.128规定的响度单位有三个:响度电平、响度范围和真实峰值电平。
1.响度电平(Loudness Level)
响度电平用来描述节目的响度,即被测音频节目在指定的重放条件及相同的播出时长下,其主观音量相较于标准参考节目的大小。EBU制式的响度电平分为LUFS(参照满度电平)和LU(参照校准电平)两种,-23.0 LUFS = 0.0 LU(带有1位小数),数值越大,节目越响。
相同响度电平的节目,音量基本一致 。LU值的相反数表示将节目标准化到参考响度所需的增益。控制节目的响度电平,可有效提高播出音量的一致性。
(1)响度算法
EBU R.128沿用ITU-R BS.1770定义的、基于K计权的响度算法。这种算法实现简单,并且适合测量从单声道到5.1声道的各种音频。算法共分三步:
第一步,用一个滑动矩形窗,从待测音频中,截取一段时长为T的响度块,进行K计权滤波。K计权滤波器由前置滤波器和RLB滤波器串联而成,前置滤波器用来模仿人头部高频搁架式抬升的频率响应,而RLB滤波器则用来模仿人耳低频滚降的听觉特性。
第二步,计算出滤波后,各声道音频样本的均方能量:
最后,对各声道的均方值进行加权累加、取对数值,就可获得响度电平。不同声道的加权值不同,如图1。
滑动矩形窗的长度虽然为秒级,但每次截取的音频片断都有所重叠,因此响度电平的示值仍然能够以较高的频率更新显示,能够满足实时测量的要求。
(2)三种响度示值
EBU R.128规定了三种响度示值:瞬时响度、短时响度和整体响度(integrated loudness),具有不同的时间尺度(如表2)。瞬时响度与短时响度的时间尺度为秒,适合现场制作的实时观察及广告的响度控制;整体响度的时间尺度是整个节目,适合节目质量分析及自动化的响度对齐。
其中,整体响度带有“选通测量”(gated measurement)算法,去除节目底声(“背景声”),保证其示值主要反映“节目主体”(或“前景声”)在整个节目时长上的平均响度。节目主体包含对白、音乐以及关键音效,它们是主观响度的主要成分;而底噪、静音、垫乐等背景成分,对于响度几乎没有贡献,却会拉低响度平均值 ,影响响度对齐的一致性。
整体响度电平实际是通过拆分成瞬时响度块计算的。选通测量的所谓“选通”,就是将计算过程中,响度电平低于门限的响度块数据去掉。为了让结果更加精确(尤其是短节目),R.128规定,用于计算整体响度的两个瞬时响度块之间,带有75%(0.1秒)的重叠 。
选通测量分为两步,首先进行绝对选通,去掉瞬时响度电平低于-70 LUFS(绝对选通门限)的响度块,计算剩余响度块的总体响度;接着进行相对选通,去掉比前述总体响度电平低10 LU的响度块,然后再次计算剩余响度块的总体响度,所得结果即为最终的整体响度电平。
实时响度表每个时刻的整体响度及其相对选通门限都由响度的历史数据重新确定和计算,所以计量结果与非实时响度表基本一致(最大误差为0.1LU)。
2.响度范围(Loudness Range,LRA)
响度范围,用来描述节目的响度反差,即节目短时响度电平的离散度,或者说最常出现的那85%的响度的分布范围,它决定着是否根据目标受众对节目的动态范围进行压缩。
响度范围的大小与节目类型有关。流行音乐、广告等节目通常都进行了良好的压缩、激励甚至削波处理,响度范围小(一般为2~5 LU),能量集中,听起来很破甚至非常吵闹,压迫感强烈;新闻、访谈节目的响度范围比较适中,听感较为舒适(6~10 LU);而电影、电视剧、戏曲、交响乐等节目出于艺术表现,响度范围较大(10 LU以上),声音比较闷,经压限处理之后才能在电视上良好地重放。
响度范围的测量方法分为如下4步:
(1)将节目音频切割成相互重叠(至少2秒相互重叠)的短时响度块;
(2)以响度为横轴,出现的概率密度为纵轴,绘制出节目的响度-概率分布图;
(3)去掉低于-70 LUFS(静音)及绝对选通总体响度下方20LU(底声)的横轴部分;
(4)剩余响度累积分布函数的10%至95%两点之间所对应的横轴宽度,即为响度范围。
选通测量去掉了节目的静音和不太重要的背景声。10%至95%的概率设置,避免了极少数异常的音效(笑声、掌声、枪声等)对响度范围的干扰。
3.真实峰值电平(True Peak Level)
我们习惯使用的PPM“峰值电平”是准峰值电平,与确切的峰值电平存在较大误差 。模拟准峰值表(QPPM)的瞬态响应受上升时间的限制 ,无法显示短于上升时间的峰值;而以采样峰值表(sample peak meters)方式实现的数字PPM表,指示的是采样点的极大值,无法反映采样点之间的峰值 。 电视台的分发传输链路日渐数字化,音频编解码器在压缩过程中会缩减信号的带宽,或者去除听觉不敏感的成分,这些过程都会产生附加的振铃和上冲,使得音频的峰值电平提高。这种振铃和上冲,无法在PPM表上看到,却有可能引起播出传输过程中的削波及过调。
真实峰值电平表(TP表)是改进的采样峰值表,它先对音频进行至少4倍的升采样(例如,从48kHz插值到192kHz),再读取采样峰值。相对于PPM表,TP表的误差较小(0.5dB),可减少为示数的不确定性预留的余量,最大化地利用数字信号的动态范围。
真实峰值电平的单位为dBTP或TPFS,以满度电平为参考。
二. 响度控制目标
1.规范响度电平
响度控制的首要目标是将节目切换点的突跳控制在舒适区,它要求素材间的响度基本一致或者有所过渡。其次,是设法让所有的节目素材都围绕着标准响度电平制作播出。这里的围绕并不是要求节目每时每刻的响度都符合目标响度,而是节目主体(对白)部分的响度重心,稳定在目标响度上。此外,还要限制节目的最大短时响度,避免广告(尤其是节目内插广告)对短时响度的滥用。
在节目已经制作完毕的情况下,调整节目的整体响度通常采用改变增益的办法。不过它只改变整体响度,不改变动态范围,在提升峰值储备较大的节目时还可能引起削波,因此需要后续两步作为补充。
对于标准响度电平,EBU R.128-2011标准规定,节目的整体响度应当标准化至-23.0 LUFS的目标响度电平(Target Level)(带有选通测量)。直播节目的节目响度与目标响度电平的偏差一般不超过±1 LU。 此时,如果节目经过良好制作,则整体响度相同的两个节目,基本上是一样响。
对于很短的节目,EBU Tech 3343认为,其最大瞬时响度应控制在-15 LUFS,短时响度应控制在-20 LUFS。
对于舒适区,ITU-R BS.1864建议书认为,听众可以容忍的响度变化“舒适区”,是“偏离理想的响度约+3至-5 dB的响度窗口。”超过舒适区,观众有明显的变吵或变小的感觉。
从响度电平的计算公式可以看出,单声道音源在传统编码器或者机顶盒复制成双声道之后,响度电平将增加3 dB。此时应按双声道计算响度,才能保证响度测量的准确。此外,单声道的频道在播出时,最好以“单声道”或者 “双单声道”(伪立体声)方式播出,而不要采用“立体声-仅左声道”方式播出,避免节目在机顶盒“立体声/单声道/左声道/右声道”四种模式下播出音量的不一致,这样才能保证单声道频道在任何声道模式下(包括模拟播出时)的响度都与立体声频道一致。
2.控制响度范围
响度范围需要与听音环境相匹配。听音环境的动态范围受限于居室的本底噪声、听觉的痛阈及最大还音功率。典型居室的本底噪声在45~55dBA,而电视的典型收听音量为60~75dBA,因此电视所能重现的动态范围,或者说响度范围容限(DRT)很窄,只有20dB左右。轻薄便携的液晶电视甚至更差,因为留给扬声器的空间很小,功率做不大,并且为了降低功耗,常常使用底噪较大的D类功放。
响度范围过大的负面效应多见于电影和电视剧,观众常常会感觉到节目沉闷,因为它们是为大荧幕制作的,影剧院通常都具有良好的装修和一流的音响,而电视不能还原那么大的动态范围,此时就需要进行响度范围转换,对较弱的片断进行提升,对少数过响的音效进行限制。这可利用一个低门限值(小于-40dBFS)低压缩比(1:1.2~1:1.5)且带有补偿增益(make-up gain)的压缩器实现,提升听觉体验。而对于广告这类能量集中的节目来说,可直接平移节目的响度电平,有时甚至应当以短时响度的最大值作为广告响度的依据,进行响度惩罚,超得越多,降得越多。笔者认为,对于标清语言类电视节目,在不造成明显失真的前提下,LRA控制在6~12会比较舒适,既不会太闷,也不会太吵。
响度范围过大的另一个原因是节目制作不规范,节目内嵌多段整体响度不同的素材,类似于台阶。这种节目的LRA和整体响度并不真正反映节目的类型和响度的重心,并且起伏很大,难以校正。多代引用这类节目素材时会引起响度参差的累积,造成高阶响度问题,必须在制作阶段就予以解决。
一个节目的LRA如果和流派不相符,那么这个节目的制作就可能存在问题,例如上文提到的响度参差(会使响度范围变大),以及电平不匹配引起的削波(会使响度范围变小)。
(这个节目的整体响度为-22.5LUFS,其中1是宣传片片头,2~13号素材为广告。片头响度过大。
若按片头平移响度,则素材2、3、4、6、7、9、10、12、13的响度都将低于-30LUFS)
3.限制峰值电平
限制峰值电平,保证不过调、不切峰,是安全播出的需要。
EBU R.128推荐的制作域的最大允许真实峰值电平为-1dBTP,播出系统受传输、发射设备的限制,最大峰值电平要降低许多。在设定播出的最大峰值电平标准时,应当全面了解传输设备特别是模拟传输设备的峰值储备及增益情况。
对于单位增益的数字电视传输来说,其最高峰值电平可设置为-1dBTP(对于立体声频道为-4dBTP),但按照我国现行的GY/T 223-2007标准,应设为-6dBTP。即便标准放开,也应酌情考虑传输编解码及数模转换所带来的峰值升高。中央台目前采用的最高峰值电平即为-6dBTP。
对于模拟电视发射,EBU Tech3344建议,PAL D/K发射机的限制器门限为-6.7dBTP。当向发射机送入-6.7dBTP 1kHz正弦信号时,发射机的峰值调制度应刚好限制于50kHz。限制器置于预加重之后,保证调制度不超标。
三.播出级响度控制 从播出部门先行缓解响度问题,涉及的设备和部门相对较少,并且节目素材集中,标准容易实现。依响度控制设备位置的不同,可分为信号流响度控制和文件型响度控制。两种方式各有优缺点,因此播出部门应当根据自身情况选择最适合自己的技术。
播出响度突跳的主要原因是自办栏目与广告响度的不匹配(严格地说,是自办栏目的响度偏小。因为台内的制作人员通常不对,也没有条件对节目进行精细的动态范围处理,峰值储备较大),此外还有节目内部各段素材之间的响度不匹配。在播出级主要处理的是离散的节目来源和上载操作所引起的响度不匹配,广告内部及节目内部响度参差的调整不属播出级响度控制的职责,应退回制作线修改。迁就这些节目,会使正常节目的音频质量发生恶化。
1.信号流响度控制
信号流响度控制是在信号通道对播出响度进行规范,一般是在播出末级串接响度控制器或响度服务器,对响度进行实时控制。响度控制器不仅可以校正响度,还能够上下混音,规范播出音频的格式。响度控制器是一种改进的自动电平控制器,通常由自动响度校正(ALC)、动态范围控制(DRC)、限制器(Limiter)三级串接完成。
ALC是改进的自动电平控制器,它对节目的瞬间及短时响度进行实时测量,以响度电平为反馈值调整增益,按一定比例缩小响度差异。ALC具有多个缓慢的时间常数,同时限制了增益与衰减范围,防止节目寂静片断或背景噪声的过度提升。因为时间常数缓慢,ALC级只具有轻微的动态范围控制能力。
LRA的控制由DRC级完成。DRC级是一个改进的多段压限器,它对高电平的声音进行压缩,限制过响的音效,对中电平的声音进行提升,提高语音的清晰度,又对低电平进行扩张,抑制背景噪声。
限制器对门限之上的音频信号进行∞:1的硬限制和柔性剪峰,避免超限电平的出现。
响度控制器是一种简洁的响度控制手段,但它与播控系统是分离的,因此处理的效果依赖于输入响度的离散度,不合适的参数会使音频出现一定程度的劣化;当输入信号与目标响度的差异超出校正范围时,播出响度仍会超标。因此在刚开始进行响度控制的时候,需要比较严格的参数,随着制作的规范,逐渐放开控制程度。此外,响度控制器的音视频是分开处理的,使用时应特别留意声画同步;作为在线设备,应具备掉电直通。
2.文件型响度控制
文件型响度控制是通过响度服务器及控制软件对播出服务器的素材响度进行规范。响度控制软件从上载服务器拉取新上载素材文件的音频,进行响度缩放及动态范围控制,然后生成新的音频,重新打包成完整的素材。文件型响度处理可以提供精确的响度对齐,对广告音量的控制尤其有效,通过多次通过处理(multi-pass process),可以获得准确的响度范围控制。
文件型响度控制对原有系统的依赖性强,响度控制置于上载迁移流程的哪个位置,怎么对素材进行转码,是审看前、审看后,还是迁移时,如何区分已转换和未转换的素材,如何进行一致性管理,关系到播出的安全和稳定,要解决这些问题,必须要有一套自动化的技审方案。
此外,文件型响度控制只能处理硬盘素材,无法处理直、转播信号及录像机信源。
信号流响度控制与文件型响度控制并不是对立的。文件存取与信号流处理相比较为复杂,因此容易出现问题,可靠性较差。对此,我们可以将扫描到的素材响度及节目切换点信息通过RS485等接口发送给外部设备,指导信号流设备的增益调控,完成响度处理,做到这点,需要各厂商的通力合作。
四.展望
EBU R.128对ITU-R BS.1770标准做了十分有益的补充,其配套技术文档为响度控制提供了重要指导。从播出级先行进行响度控制,可以尽早缓解响度突跳,提高播出质量,并为响度控制提供经验,将响度标准化工作从播出级逐渐推广到制作级。R.128与其它标准大同小异,了解R.128,有助于更好地理解其它各种响度标准。
参考文献
[1] GY/T 223-2007, 标准清晰度数字电视节目录像磁带录制规范 [EB/OL], 2007.04
[2] ITU-R BS.1726, Signal level of digital audio accompanying television in international programme exchange [EB/OL], 2005
[3] ITU-R BS.1770-1, Algorithms to measure audio programme loudness and true-peak audio level [EB/OL], 2006-2007
[4] ITU-R BS.1771-1, Requirements for loudness and true-peak indicating meters [EB/OL], 2012.01
[5] EBU R.128-2011, Loudness normalisation and permitted maximum level of audio signals [EB/OL], 2011.08
[6] EBU Tech 3341, Loudness Metering: 'EBU Mode' metering to supplement loudness normalisation in accordance with EBU R 128 [EB/OL], 2010.12
[7] EBU Tech 3343, Practical guidelines for Production and Implementation in accordance with EBU R 128 [EB/OL], 2011.02
[8] EBU Tech 3344, Practical guidelines for distribution systems in accordance with EBU R 128 [EB/OL], 2011.04
[9] TC Electronic, Algorithms DB8/DB4 Rev 2.10 [EB/OL]
[10] Linear Acoustic, AERO.file File-Based Audio/Loudness Manager [EB/OL], 2010.09
【关键词】响度电平 K计权 算法 响度范围 真实峰值电平 响度控制
电视播出的目的,是将节目安全、优质地呈现在观众面前。然而,伴随节目切换而发生的电视音量突跳(响度问题),一直困扰观众。造成响度问题的重要原因是缺少合适的客观指标。为此,ITU制订了BS.1770系列标准,推荐了一种基于RLB加权的响度算法。
EBU PLOUD小组以ITU标准为基础,制订了EBU R.128建议书,对响度的被测主体、积分窗长等细节作了更加明确的定义,其配套的Tech 3341、3342、3343、3344文档,详细介绍了EBU制式(EBU Mode)响度单位的定义与测量、响度控制,以及制作、传输等环节应当注意的事项,对电视台解决响度问题及音频的安全播出具有重要的指导意义。本文介绍的是EBU最新修订的R.128-2011。
一.响度单位的定义与测量
EBU R.128规定的响度单位有三个:响度电平、响度范围和真实峰值电平。
1.响度电平(Loudness Level)
响度电平用来描述节目的响度,即被测音频节目在指定的重放条件及相同的播出时长下,其主观音量相较于标准参考节目的大小。EBU制式的响度电平分为LUFS(参照满度电平)和LU(参照校准电平)两种,-23.0 LUFS = 0.0 LU(带有1位小数),数值越大,节目越响。
相同响度电平的节目,音量基本一致 。LU值的相反数表示将节目标准化到参考响度所需的增益。控制节目的响度电平,可有效提高播出音量的一致性。
(1)响度算法
EBU R.128沿用ITU-R BS.1770定义的、基于K计权的响度算法。这种算法实现简单,并且适合测量从单声道到5.1声道的各种音频。算法共分三步:
第一步,用一个滑动矩形窗,从待测音频中,截取一段时长为T的响度块,进行K计权滤波。K计权滤波器由前置滤波器和RLB滤波器串联而成,前置滤波器用来模仿人头部高频搁架式抬升的频率响应,而RLB滤波器则用来模仿人耳低频滚降的听觉特性。
第二步,计算出滤波后,各声道音频样本的均方能量:
最后,对各声道的均方值进行加权累加、取对数值,就可获得响度电平。不同声道的加权值不同,如图1。
滑动矩形窗的长度虽然为秒级,但每次截取的音频片断都有所重叠,因此响度电平的示值仍然能够以较高的频率更新显示,能够满足实时测量的要求。
(2)三种响度示值
EBU R.128规定了三种响度示值:瞬时响度、短时响度和整体响度(integrated loudness),具有不同的时间尺度(如表2)。瞬时响度与短时响度的时间尺度为秒,适合现场制作的实时观察及广告的响度控制;整体响度的时间尺度是整个节目,适合节目质量分析及自动化的响度对齐。
其中,整体响度带有“选通测量”(gated measurement)算法,去除节目底声(“背景声”),保证其示值主要反映“节目主体”(或“前景声”)在整个节目时长上的平均响度。节目主体包含对白、音乐以及关键音效,它们是主观响度的主要成分;而底噪、静音、垫乐等背景成分,对于响度几乎没有贡献,却会拉低响度平均值 ,影响响度对齐的一致性。
整体响度电平实际是通过拆分成瞬时响度块计算的。选通测量的所谓“选通”,就是将计算过程中,响度电平低于门限的响度块数据去掉。为了让结果更加精确(尤其是短节目),R.128规定,用于计算整体响度的两个瞬时响度块之间,带有75%(0.1秒)的重叠 。
选通测量分为两步,首先进行绝对选通,去掉瞬时响度电平低于-70 LUFS(绝对选通门限)的响度块,计算剩余响度块的总体响度;接着进行相对选通,去掉比前述总体响度电平低10 LU的响度块,然后再次计算剩余响度块的总体响度,所得结果即为最终的整体响度电平。
实时响度表每个时刻的整体响度及其相对选通门限都由响度的历史数据重新确定和计算,所以计量结果与非实时响度表基本一致(最大误差为0.1LU)。
2.响度范围(Loudness Range,LRA)
响度范围,用来描述节目的响度反差,即节目短时响度电平的离散度,或者说最常出现的那85%的响度的分布范围,它决定着是否根据目标受众对节目的动态范围进行压缩。
响度范围的大小与节目类型有关。流行音乐、广告等节目通常都进行了良好的压缩、激励甚至削波处理,响度范围小(一般为2~5 LU),能量集中,听起来很破甚至非常吵闹,压迫感强烈;新闻、访谈节目的响度范围比较适中,听感较为舒适(6~10 LU);而电影、电视剧、戏曲、交响乐等节目出于艺术表现,响度范围较大(10 LU以上),声音比较闷,经压限处理之后才能在电视上良好地重放。
响度范围的测量方法分为如下4步:
(1)将节目音频切割成相互重叠(至少2秒相互重叠)的短时响度块;
(2)以响度为横轴,出现的概率密度为纵轴,绘制出节目的响度-概率分布图;
(3)去掉低于-70 LUFS(静音)及绝对选通总体响度下方20LU(底声)的横轴部分;
(4)剩余响度累积分布函数的10%至95%两点之间所对应的横轴宽度,即为响度范围。
选通测量去掉了节目的静音和不太重要的背景声。10%至95%的概率设置,避免了极少数异常的音效(笑声、掌声、枪声等)对响度范围的干扰。
3.真实峰值电平(True Peak Level)
我们习惯使用的PPM“峰值电平”是准峰值电平,与确切的峰值电平存在较大误差 。模拟准峰值表(QPPM)的瞬态响应受上升时间的限制 ,无法显示短于上升时间的峰值;而以采样峰值表(sample peak meters)方式实现的数字PPM表,指示的是采样点的极大值,无法反映采样点之间的峰值 。 电视台的分发传输链路日渐数字化,音频编解码器在压缩过程中会缩减信号的带宽,或者去除听觉不敏感的成分,这些过程都会产生附加的振铃和上冲,使得音频的峰值电平提高。这种振铃和上冲,无法在PPM表上看到,却有可能引起播出传输过程中的削波及过调。
真实峰值电平表(TP表)是改进的采样峰值表,它先对音频进行至少4倍的升采样(例如,从48kHz插值到192kHz),再读取采样峰值。相对于PPM表,TP表的误差较小(0.5dB),可减少为示数的不确定性预留的余量,最大化地利用数字信号的动态范围。
真实峰值电平的单位为dBTP或TPFS,以满度电平为参考。
二. 响度控制目标
1.规范响度电平
响度控制的首要目标是将节目切换点的突跳控制在舒适区,它要求素材间的响度基本一致或者有所过渡。其次,是设法让所有的节目素材都围绕着标准响度电平制作播出。这里的围绕并不是要求节目每时每刻的响度都符合目标响度,而是节目主体(对白)部分的响度重心,稳定在目标响度上。此外,还要限制节目的最大短时响度,避免广告(尤其是节目内插广告)对短时响度的滥用。
在节目已经制作完毕的情况下,调整节目的整体响度通常采用改变增益的办法。不过它只改变整体响度,不改变动态范围,在提升峰值储备较大的节目时还可能引起削波,因此需要后续两步作为补充。
对于标准响度电平,EBU R.128-2011标准规定,节目的整体响度应当标准化至-23.0 LUFS的目标响度电平(Target Level)(带有选通测量)。直播节目的节目响度与目标响度电平的偏差一般不超过±1 LU。 此时,如果节目经过良好制作,则整体响度相同的两个节目,基本上是一样响。
对于很短的节目,EBU Tech 3343认为,其最大瞬时响度应控制在-15 LUFS,短时响度应控制在-20 LUFS。
对于舒适区,ITU-R BS.1864建议书认为,听众可以容忍的响度变化“舒适区”,是“偏离理想的响度约+3至-5 dB的响度窗口。”超过舒适区,观众有明显的变吵或变小的感觉。
从响度电平的计算公式可以看出,单声道音源在传统编码器或者机顶盒复制成双声道之后,响度电平将增加3 dB。此时应按双声道计算响度,才能保证响度测量的准确。此外,单声道的频道在播出时,最好以“单声道”或者 “双单声道”(伪立体声)方式播出,而不要采用“立体声-仅左声道”方式播出,避免节目在机顶盒“立体声/单声道/左声道/右声道”四种模式下播出音量的不一致,这样才能保证单声道频道在任何声道模式下(包括模拟播出时)的响度都与立体声频道一致。
2.控制响度范围
响度范围需要与听音环境相匹配。听音环境的动态范围受限于居室的本底噪声、听觉的痛阈及最大还音功率。典型居室的本底噪声在45~55dBA,而电视的典型收听音量为60~75dBA,因此电视所能重现的动态范围,或者说响度范围容限(DRT)很窄,只有20dB左右。轻薄便携的液晶电视甚至更差,因为留给扬声器的空间很小,功率做不大,并且为了降低功耗,常常使用底噪较大的D类功放。
响度范围过大的负面效应多见于电影和电视剧,观众常常会感觉到节目沉闷,因为它们是为大荧幕制作的,影剧院通常都具有良好的装修和一流的音响,而电视不能还原那么大的动态范围,此时就需要进行响度范围转换,对较弱的片断进行提升,对少数过响的音效进行限制。这可利用一个低门限值(小于-40dBFS)低压缩比(1:1.2~1:1.5)且带有补偿增益(make-up gain)的压缩器实现,提升听觉体验。而对于广告这类能量集中的节目来说,可直接平移节目的响度电平,有时甚至应当以短时响度的最大值作为广告响度的依据,进行响度惩罚,超得越多,降得越多。笔者认为,对于标清语言类电视节目,在不造成明显失真的前提下,LRA控制在6~12会比较舒适,既不会太闷,也不会太吵。
响度范围过大的另一个原因是节目制作不规范,节目内嵌多段整体响度不同的素材,类似于台阶。这种节目的LRA和整体响度并不真正反映节目的类型和响度的重心,并且起伏很大,难以校正。多代引用这类节目素材时会引起响度参差的累积,造成高阶响度问题,必须在制作阶段就予以解决。
一个节目的LRA如果和流派不相符,那么这个节目的制作就可能存在问题,例如上文提到的响度参差(会使响度范围变大),以及电平不匹配引起的削波(会使响度范围变小)。
(这个节目的整体响度为-22.5LUFS,其中1是宣传片片头,2~13号素材为广告。片头响度过大。
若按片头平移响度,则素材2、3、4、6、7、9、10、12、13的响度都将低于-30LUFS)
3.限制峰值电平
限制峰值电平,保证不过调、不切峰,是安全播出的需要。
EBU R.128推荐的制作域的最大允许真实峰值电平为-1dBTP,播出系统受传输、发射设备的限制,最大峰值电平要降低许多。在设定播出的最大峰值电平标准时,应当全面了解传输设备特别是模拟传输设备的峰值储备及增益情况。
对于单位增益的数字电视传输来说,其最高峰值电平可设置为-1dBTP(对于立体声频道为-4dBTP),但按照我国现行的GY/T 223-2007标准,应设为-6dBTP。即便标准放开,也应酌情考虑传输编解码及数模转换所带来的峰值升高。中央台目前采用的最高峰值电平即为-6dBTP。
对于模拟电视发射,EBU Tech3344建议,PAL D/K发射机的限制器门限为-6.7dBTP。当向发射机送入-6.7dBTP 1kHz正弦信号时,发射机的峰值调制度应刚好限制于50kHz。限制器置于预加重之后,保证调制度不超标。
三.播出级响度控制 从播出部门先行缓解响度问题,涉及的设备和部门相对较少,并且节目素材集中,标准容易实现。依响度控制设备位置的不同,可分为信号流响度控制和文件型响度控制。两种方式各有优缺点,因此播出部门应当根据自身情况选择最适合自己的技术。
播出响度突跳的主要原因是自办栏目与广告响度的不匹配(严格地说,是自办栏目的响度偏小。因为台内的制作人员通常不对,也没有条件对节目进行精细的动态范围处理,峰值储备较大),此外还有节目内部各段素材之间的响度不匹配。在播出级主要处理的是离散的节目来源和上载操作所引起的响度不匹配,广告内部及节目内部响度参差的调整不属播出级响度控制的职责,应退回制作线修改。迁就这些节目,会使正常节目的音频质量发生恶化。
1.信号流响度控制
信号流响度控制是在信号通道对播出响度进行规范,一般是在播出末级串接响度控制器或响度服务器,对响度进行实时控制。响度控制器不仅可以校正响度,还能够上下混音,规范播出音频的格式。响度控制器是一种改进的自动电平控制器,通常由自动响度校正(ALC)、动态范围控制(DRC)、限制器(Limiter)三级串接完成。
ALC是改进的自动电平控制器,它对节目的瞬间及短时响度进行实时测量,以响度电平为反馈值调整增益,按一定比例缩小响度差异。ALC具有多个缓慢的时间常数,同时限制了增益与衰减范围,防止节目寂静片断或背景噪声的过度提升。因为时间常数缓慢,ALC级只具有轻微的动态范围控制能力。
LRA的控制由DRC级完成。DRC级是一个改进的多段压限器,它对高电平的声音进行压缩,限制过响的音效,对中电平的声音进行提升,提高语音的清晰度,又对低电平进行扩张,抑制背景噪声。
限制器对门限之上的音频信号进行∞:1的硬限制和柔性剪峰,避免超限电平的出现。
响度控制器是一种简洁的响度控制手段,但它与播控系统是分离的,因此处理的效果依赖于输入响度的离散度,不合适的参数会使音频出现一定程度的劣化;当输入信号与目标响度的差异超出校正范围时,播出响度仍会超标。因此在刚开始进行响度控制的时候,需要比较严格的参数,随着制作的规范,逐渐放开控制程度。此外,响度控制器的音视频是分开处理的,使用时应特别留意声画同步;作为在线设备,应具备掉电直通。
2.文件型响度控制
文件型响度控制是通过响度服务器及控制软件对播出服务器的素材响度进行规范。响度控制软件从上载服务器拉取新上载素材文件的音频,进行响度缩放及动态范围控制,然后生成新的音频,重新打包成完整的素材。文件型响度处理可以提供精确的响度对齐,对广告音量的控制尤其有效,通过多次通过处理(multi-pass process),可以获得准确的响度范围控制。
文件型响度控制对原有系统的依赖性强,响度控制置于上载迁移流程的哪个位置,怎么对素材进行转码,是审看前、审看后,还是迁移时,如何区分已转换和未转换的素材,如何进行一致性管理,关系到播出的安全和稳定,要解决这些问题,必须要有一套自动化的技审方案。
此外,文件型响度控制只能处理硬盘素材,无法处理直、转播信号及录像机信源。
信号流响度控制与文件型响度控制并不是对立的。文件存取与信号流处理相比较为复杂,因此容易出现问题,可靠性较差。对此,我们可以将扫描到的素材响度及节目切换点信息通过RS485等接口发送给外部设备,指导信号流设备的增益调控,完成响度处理,做到这点,需要各厂商的通力合作。
四.展望
EBU R.128对ITU-R BS.1770标准做了十分有益的补充,其配套技术文档为响度控制提供了重要指导。从播出级先行进行响度控制,可以尽早缓解响度突跳,提高播出质量,并为响度控制提供经验,将响度标准化工作从播出级逐渐推广到制作级。R.128与其它标准大同小异,了解R.128,有助于更好地理解其它各种响度标准。
参考文献
[1] GY/T 223-2007, 标准清晰度数字电视节目录像磁带录制规范 [EB/OL], 2007.04
[2] ITU-R BS.1726, Signal level of digital audio accompanying television in international programme exchange [EB/OL], 2005
[3] ITU-R BS.1770-1, Algorithms to measure audio programme loudness and true-peak audio level [EB/OL], 2006-2007
[4] ITU-R BS.1771-1, Requirements for loudness and true-peak indicating meters [EB/OL], 2012.01
[5] EBU R.128-2011, Loudness normalisation and permitted maximum level of audio signals [EB/OL], 2011.08
[6] EBU Tech 3341, Loudness Metering: 'EBU Mode' metering to supplement loudness normalisation in accordance with EBU R 128 [EB/OL], 2010.12
[7] EBU Tech 3343, Practical guidelines for Production and Implementation in accordance with EBU R 128 [EB/OL], 2011.02
[8] EBU Tech 3344, Practical guidelines for distribution systems in accordance with EBU R 128 [EB/OL], 2011.04
[9] TC Electronic, Algorithms DB8/DB4 Rev 2.10 [EB/OL]
[10] Linear Acoustic, AERO.file File-Based Audio/Loudness Manager [EB/OL], 2010.09