论文部分内容阅读
问:所有的数字设备使用字时钟发生器,这才是最好的吗?
请Hugh Robjohns写一篇全面的文章来说明一下用字时钟信号同步工作室设备相对于其他方 法的好处和坏处,可以吗?再进一步来说,如果音频在录制的时候已经有了时钟参考,那么 回放链(可能包含多个下行信号处理器)仍然需要同步参考吗?或是在录制数据中保持时钟 信息以供所有下行设备参考,保持正确的关联,需要吗?最后,考虑到jitter,我们会使用外 部主时钟来同步设备链来预防它吗?
Hugh Robjohns的回答:
有关数字音频工作的多方面的实际应用,我们计划近期会推出一系列的文章来探讨一下。在 这里,我还是先探讨一下你的问题。
许多设备都只接受简单的字时钟参考输入,而不像AES或复合视频参考,这完全是因为它们 简单而便宜。然而,对于只使用字时钟格式来说,这其中并没有什么重要的技术优势。有些 人可能会质疑通过字时钟信号环接许多设备的能力,而这些设备使用T字型BNC(同轴电缆 使用)头来形成字时钟链。但它确实是廉价而便捷的参考时钟分配方案。问题就是当设备工 作在受控(slave)的情况下,如果设备没有(或不能)被正确配置,又或者在没有正确地重 新设计下而改变设备的连接,在这样的情况下,就会有很多潜在的危险发生。相比之下,由 Hub(集线器)或主时钟发生器,以及使用字时钟的AES构成的时钟信号星型分配方式要好 很多,稳定性也强很多。
至于你的第二个问题,从定义上来说,数字录音必须使用源设备的时钟做参考。这些参考大 多是由模/数转换器的内部晶体振荡器所提供的。当数字音频从一台设备传向下一台设备(比 如:使用AES,S/PDIF,SDIF3,MADI或ADAT接口)时,对于每个并发传送来说,时钟 信息都是完全包含在音频中并传送的。假定设备已经被配置为从它的输入信号来汲取内部参 考时钟,那么它就不一定需要来自于主时钟发生器系统的独立参考时钟信号了,这已经不重 要了。然而,对于许多设备来说,使用一个中心主时钟为整个系统提供稳定的时钟参考还是 有很多实际意义和技术上的好处的。(图1: Drawmer D-Clock 总共可以提供20个字时钟输出。)
Jitter(由于连接线以及转换器的质量所引起的时钟脉冲混乱现象,基于英文的初衷以及我知识 的有限,我没有给它做一个中文定义,日后我会下一个准确定义,毕竟这个方面中文规范太 混乱了)是所有时钟系统的天敌,因为它对采样时序引入了一定的不确定因素,并转化为底噪 的提升,并发有多种噪声调制效果。这通常都会在模/数和数/模转换过程中导致立体声声像模 糊而不稳定。还有一点我们要注意到,jitter效果只会影响到模拟和数字之间的转换。对于在 数字设备间的数字传送来说,即便是非常严重的jitter,那也是完全不会有什么影响的。
高品质的主时钟应该只有很少的内部jitter,但那也无法向你保证这是个无jitter的系统。有三 种主要因素会导致jitter:低劣的时钟设计,较差的时钟恢复电路(模-数/数-模转换器中的一 部分,用来从接收到的数字信号或参考信号中提取时钟数据),还有设备间连接线的好坏。这 其中,连接线的好坏以及时钟恢复电路的影响最大。连接线的固有电容会限制数据的转换率-信号从二进制状态向其他状态转变的快慢。对于许多数字设备的输出来说,数据会被完美地 从一种状态转换到另一种状态,形成很漂亮的方波。但是当它到达其他设备的输入时,连接 线的电容效应会改变它的形状,有些波形被变成了三角波。通常,在时钟参考脉冲方波时序 的下降沿,数据波形都会以此为中心线进行转换,如果“垂直传送”因连接线的电容效应变 得倾斜(译者:也就是方波边缘倾斜,类似三角波),那么转换的准确点也就变得很模糊--这 就是jitter!
连接线的电容效应越大,问题也就越严重。所以,短而低容性的高质量连接线可以保留好时 钟信息,长而便宜的高容性连接线就差强人意了。很明显,光纤的传送就不会受到电容效应 的制约,但是它们必须拥有相等的散射率。如果用来制造光纤的玻璃或塑料的品质并不是很 好的话,光脉冲就会在传送的过程中被衰减变弱,这也会导致同样的jitter问题。
所幸,高品质的时钟恢复电路能够阻挡连接线的jitter效应,有很多团队花费了大量的努力来 设计好的阻挡jitter的时钟恢复电路。问题在于许多阻挡jitter的技术在很大程度上对于响应 和同步来说都是比较慢(从反应速度上来说)的,因此在这方面也只能暂时达成一定技术上 的“妥协”。
所以,由连接线引入的时钟jitter通常会混入时钟恢复电路,这并不是个惊喜。我们从中学习 到了使用模/数转换器的内部晶振时钟作为参考,不论是对于转换本身还是其他的数字系统来 说,这都要好过于使用一个外部时钟做参考。当然 ,这也需要假定我们拥有一个高品质低jitter 时钟的转换器。如果不是这样,使用外部时钟参考可能会达到更好的效果,尽管你对设备时 钟恢复电路的jitter阻挡容性效应的能力还留有些许期望。
有的时候,对于一个外部时钟模/数转换器来说是毫无选择的,比如,在你需要同步多台独立 的模/数转换器来进行多通道录音的时候。使用短的时钟连接线把高质量的转换器连接到共用 的主参考时钟,这会是最好而最实际的解决办法。另一种办法就是让转换器都工作在自己的 内部时钟下,然后使用采样率转换器再来同步他们的输出,并送至共用的时钟参考--比较昂 贵的选择,而且可能会引入一整套我们所不希望听到的人造声。
Q:对于立体声录制来说,话筒一定要配对么?
在进行立体声录制的时候,我确实需要使用一对“配对”的话筒,或是两个同牌同型号的话筒吗?我猜想专业的录制肯定需要尽可能好的音质,但是对于业余一点的我们来说,这并没 有太大的差别。难道话筒不同,就录不出好的立体声吗?
技术编辑Hugh Robjohns回答:
不同的话筒会听起来......,唉!确实不同!他们会有不同的频响,更为重要的是他们有着不同 的极性拾取特性。两支极性响应大不相同的话筒,对应于信号的频率来说,也会有不同的表现。
如果你想要使用两支不同的话筒来进行X-Y制立体声录音,结果一定会出现不稳定和不清晰 的立体声声像,飘忽不定。对于不同的乐器,它们可能会在不同的方面影响到声像。这并不 是个小问题,仅仅是两支话筒微小的差别就会导致严重的问题。这也就是为什么高端话筒制 造商要费劲心思和耐心来不断保持自身产品严格配对的原因所在了。也是基于这个原因,很 多话筒产品也更为便捷地提供了手动选择“配对”功能。(图2:即便是两只在极性和频响特性相 差甚小的麦克,使用X-Y制录音的时候也会有一定的不良效果出现并影响到立体声声像。使用一对经过 配对的Rode公司的NT5来录立体声,我比较推荐。)
如果你想要检测两支心型指向(或者其他指向)话筒的兼容性,我给你一个简单的实例。你 需要立体声监听,调音台,以及你在隔绝于录音室的控制室进行监听的时候,可以在话筒周 围走动并帮你摆放话筒的助手。
把两支话筒头对头摆放,一支放在另一支的上面,就像胶囊一样头对头,尽可能的靠在一 起。一支插在调音台左声道,一支插在右声道,声像分别打到极左、极右,然后调节它们 的增益使之平衡。
最简单的方法就是找个人站在话筒前面讲话。与此同时,在你监听的时候,选择单声道按钮 并反转其中一支话筒的极性。渐强第一支话筒并把增益设置到语音可听的敏感位置。然后渐 强第二支话筒,取消刚才的极性反转。调节第二支话筒的增益以获得抵消特性(相位抵消), 现在你可以移除极性反转并取消单声道监听。你应该听的到是来自于两个音箱中间作为幻听 中心声像的语音。 现在,让你的助手围着话筒走圆圈,和待测话筒保持大概的等距离移动并面对话筒。如果话 筒匹配地比较完美,尽管助手在围绕心型指向移动时,离有效拾音口的距离不同电平会明显 不同,但这个声像是不会从中线上移动的。
如果是两支不同(或匹配不好)话筒,你会听到声像飘忽或摆动,通常不同的频率成份会表 现为来自不同方向的声音--比如来自于左边的咝声,右边的基音。声像听起来会模糊、不稳 定。(图3:像Microtech Gefell这样的高端话筒制造商非常耐心细致地测试话筒配对。)
实际上在普通的X-Y制立体声配对中也会出现同样的声像错误,就是在话筒由左边旋转到右 边的时候,导致定位不准,声像模糊。那听起来明显很差劲。
对于话筒特性来说,空间摆放并不是十分受人争议,因为由极性特性所导致的电平差异,这 在立体声声像定位上启不了决定作用。但是如果它们有不同的频响,那么你还是要忍受不习 惯、不稳定的声像之苦。
人为使用不同话筒的立体声技术是统一的M&S编排--但是那需要一支话筒有心型指向特性。 即便如此,如果要得到准确的声像,更为重要的是两支话筒必须有相似的频响。除此之外, 匹配不好还会导致不稳定的声场宽度,不仅仅是声像漂移,那基本无法去听。
问:我需要两个S/PDIF输入么?
如果你有两套设备需要经由S/PDIF来连接到你的电脑接口,这需要两个S/PDIF输入么?我 只是奇怪许多声卡却只有一个S/PDIF输入和输出。
Mike Senior:
把多套拥有S/PDIF输出的设备连接到同一个设备上的问题在于所有设备的数字时钟需要被 同步,否则会带来很多数字削波。即便是拥有两个S/PDIF输入的声卡也必须拥有字时钟输入 和输出来同步它的两个输入源,或是和内部的采样率转换相一致。好的采样率转换器并不便 宜,也不容易实现,所以许多一般的声卡(包括很多硬件录音设备)都没有配备它。这就是 你为什么只找到了一对S/PDIF输入输出的原因,那没有字时钟输入输出。(图4:Roland公司 的M1000数字混音器允许你联合多个S/PDIF信号)
你也可以把多个设备通过一个S/PDIF输入送进电脑,首先信号必须被混合在一起,但要注意 混合后的信号是否过载。也还有一些不同的设备可供你使用。我马上可以想到的就是Roland 公司的M1000数字混音器和Mutec公司的智能路由器(SmartMerge router)。尽管它们会稍有 不同,但这足以解决问题,为你提供所需的采样率转换。
如果你只是想在两个源设备间转换而不想插来插去的,智能路由器也包含了这个功能。你可 能真正想要找的是一个单独的数字源交换器。
请问UAD-1效果卡的延迟是如何计算的? 答:UAD-1的延迟是让大家有点找不着方向,我根据一些官方资料为你整理一下它具体的计 算方式,但根据电脑配置的差异,声卡性能的好坏,多少会和计算结果有所出入,相信这些 你也是可以理解的。好,言归正传。
UAD-1效果卡latency(延迟)计算公式如下:
(TL) = (NP) x (SL) x 2 + (SL) (TL) - 总延迟(也就是我们要得出的延迟) (NP) - 使用在音轨上的UAD插件数 (SL) - 你系统(声卡)的延迟
如果你的声卡运行在64个采样延迟下(即1.4毫秒的延迟),当你添加一个压缩器的时候, 计算如下: 总延迟= 1 x 1.4 x 2 + 1.4 = 4.2毫秒
如果你再添加第二个插件,比如混响,计算如下: 总延迟= 2 x 1.4 x 2 + 1.4 = 7毫秒
当然,如果你的声卡延迟为10毫秒,添加两个UAD插件后,总延迟如下: 总延迟= 2 x 10 x 2 + 10 = 50毫秒
请Hugh Robjohns写一篇全面的文章来说明一下用字时钟信号同步工作室设备相对于其他方 法的好处和坏处,可以吗?再进一步来说,如果音频在录制的时候已经有了时钟参考,那么 回放链(可能包含多个下行信号处理器)仍然需要同步参考吗?或是在录制数据中保持时钟 信息以供所有下行设备参考,保持正确的关联,需要吗?最后,考虑到jitter,我们会使用外 部主时钟来同步设备链来预防它吗?
Hugh Robjohns的回答:
有关数字音频工作的多方面的实际应用,我们计划近期会推出一系列的文章来探讨一下。在 这里,我还是先探讨一下你的问题。
许多设备都只接受简单的字时钟参考输入,而不像AES或复合视频参考,这完全是因为它们 简单而便宜。然而,对于只使用字时钟格式来说,这其中并没有什么重要的技术优势。有些 人可能会质疑通过字时钟信号环接许多设备的能力,而这些设备使用T字型BNC(同轴电缆 使用)头来形成字时钟链。但它确实是廉价而便捷的参考时钟分配方案。问题就是当设备工 作在受控(slave)的情况下,如果设备没有(或不能)被正确配置,又或者在没有正确地重 新设计下而改变设备的连接,在这样的情况下,就会有很多潜在的危险发生。相比之下,由 Hub(集线器)或主时钟发生器,以及使用字时钟的AES构成的时钟信号星型分配方式要好 很多,稳定性也强很多。
至于你的第二个问题,从定义上来说,数字录音必须使用源设备的时钟做参考。这些参考大 多是由模/数转换器的内部晶体振荡器所提供的。当数字音频从一台设备传向下一台设备(比 如:使用AES,S/PDIF,SDIF3,MADI或ADAT接口)时,对于每个并发传送来说,时钟 信息都是完全包含在音频中并传送的。假定设备已经被配置为从它的输入信号来汲取内部参 考时钟,那么它就不一定需要来自于主时钟发生器系统的独立参考时钟信号了,这已经不重 要了。然而,对于许多设备来说,使用一个中心主时钟为整个系统提供稳定的时钟参考还是 有很多实际意义和技术上的好处的。(图1: Drawmer D-Clock 总共可以提供20个字时钟输出。)
Jitter(由于连接线以及转换器的质量所引起的时钟脉冲混乱现象,基于英文的初衷以及我知识 的有限,我没有给它做一个中文定义,日后我会下一个准确定义,毕竟这个方面中文规范太 混乱了)是所有时钟系统的天敌,因为它对采样时序引入了一定的不确定因素,并转化为底噪 的提升,并发有多种噪声调制效果。这通常都会在模/数和数/模转换过程中导致立体声声像模 糊而不稳定。还有一点我们要注意到,jitter效果只会影响到模拟和数字之间的转换。对于在 数字设备间的数字传送来说,即便是非常严重的jitter,那也是完全不会有什么影响的。
高品质的主时钟应该只有很少的内部jitter,但那也无法向你保证这是个无jitter的系统。有三 种主要因素会导致jitter:低劣的时钟设计,较差的时钟恢复电路(模-数/数-模转换器中的一 部分,用来从接收到的数字信号或参考信号中提取时钟数据),还有设备间连接线的好坏。这 其中,连接线的好坏以及时钟恢复电路的影响最大。连接线的固有电容会限制数据的转换率-信号从二进制状态向其他状态转变的快慢。对于许多数字设备的输出来说,数据会被完美地 从一种状态转换到另一种状态,形成很漂亮的方波。但是当它到达其他设备的输入时,连接 线的电容效应会改变它的形状,有些波形被变成了三角波。通常,在时钟参考脉冲方波时序 的下降沿,数据波形都会以此为中心线进行转换,如果“垂直传送”因连接线的电容效应变 得倾斜(译者:也就是方波边缘倾斜,类似三角波),那么转换的准确点也就变得很模糊--这 就是jitter!
连接线的电容效应越大,问题也就越严重。所以,短而低容性的高质量连接线可以保留好时 钟信息,长而便宜的高容性连接线就差强人意了。很明显,光纤的传送就不会受到电容效应 的制约,但是它们必须拥有相等的散射率。如果用来制造光纤的玻璃或塑料的品质并不是很 好的话,光脉冲就会在传送的过程中被衰减变弱,这也会导致同样的jitter问题。
所幸,高品质的时钟恢复电路能够阻挡连接线的jitter效应,有很多团队花费了大量的努力来 设计好的阻挡jitter的时钟恢复电路。问题在于许多阻挡jitter的技术在很大程度上对于响应 和同步来说都是比较慢(从反应速度上来说)的,因此在这方面也只能暂时达成一定技术上 的“妥协”。
所以,由连接线引入的时钟jitter通常会混入时钟恢复电路,这并不是个惊喜。我们从中学习 到了使用模/数转换器的内部晶振时钟作为参考,不论是对于转换本身还是其他的数字系统来 说,这都要好过于使用一个外部时钟做参考。当然 ,这也需要假定我们拥有一个高品质低jitter 时钟的转换器。如果不是这样,使用外部时钟参考可能会达到更好的效果,尽管你对设备时 钟恢复电路的jitter阻挡容性效应的能力还留有些许期望。
有的时候,对于一个外部时钟模/数转换器来说是毫无选择的,比如,在你需要同步多台独立 的模/数转换器来进行多通道录音的时候。使用短的时钟连接线把高质量的转换器连接到共用 的主参考时钟,这会是最好而最实际的解决办法。另一种办法就是让转换器都工作在自己的 内部时钟下,然后使用采样率转换器再来同步他们的输出,并送至共用的时钟参考--比较昂 贵的选择,而且可能会引入一整套我们所不希望听到的人造声。
Q:对于立体声录制来说,话筒一定要配对么?
在进行立体声录制的时候,我确实需要使用一对“配对”的话筒,或是两个同牌同型号的话筒吗?我猜想专业的录制肯定需要尽可能好的音质,但是对于业余一点的我们来说,这并没 有太大的差别。难道话筒不同,就录不出好的立体声吗?
技术编辑Hugh Robjohns回答:
不同的话筒会听起来......,唉!确实不同!他们会有不同的频响,更为重要的是他们有着不同 的极性拾取特性。两支极性响应大不相同的话筒,对应于信号的频率来说,也会有不同的表现。
如果你想要使用两支不同的话筒来进行X-Y制立体声录音,结果一定会出现不稳定和不清晰 的立体声声像,飘忽不定。对于不同的乐器,它们可能会在不同的方面影响到声像。这并不 是个小问题,仅仅是两支话筒微小的差别就会导致严重的问题。这也就是为什么高端话筒制 造商要费劲心思和耐心来不断保持自身产品严格配对的原因所在了。也是基于这个原因,很 多话筒产品也更为便捷地提供了手动选择“配对”功能。(图2:即便是两只在极性和频响特性相 差甚小的麦克,使用X-Y制录音的时候也会有一定的不良效果出现并影响到立体声声像。使用一对经过 配对的Rode公司的NT5来录立体声,我比较推荐。)
如果你想要检测两支心型指向(或者其他指向)话筒的兼容性,我给你一个简单的实例。你 需要立体声监听,调音台,以及你在隔绝于录音室的控制室进行监听的时候,可以在话筒周 围走动并帮你摆放话筒的助手。
把两支话筒头对头摆放,一支放在另一支的上面,就像胶囊一样头对头,尽可能的靠在一 起。一支插在调音台左声道,一支插在右声道,声像分别打到极左、极右,然后调节它们 的增益使之平衡。
最简单的方法就是找个人站在话筒前面讲话。与此同时,在你监听的时候,选择单声道按钮 并反转其中一支话筒的极性。渐强第一支话筒并把增益设置到语音可听的敏感位置。然后渐 强第二支话筒,取消刚才的极性反转。调节第二支话筒的增益以获得抵消特性(相位抵消), 现在你可以移除极性反转并取消单声道监听。你应该听的到是来自于两个音箱中间作为幻听 中心声像的语音。 现在,让你的助手围着话筒走圆圈,和待测话筒保持大概的等距离移动并面对话筒。如果话 筒匹配地比较完美,尽管助手在围绕心型指向移动时,离有效拾音口的距离不同电平会明显 不同,但这个声像是不会从中线上移动的。
如果是两支不同(或匹配不好)话筒,你会听到声像飘忽或摆动,通常不同的频率成份会表 现为来自不同方向的声音--比如来自于左边的咝声,右边的基音。声像听起来会模糊、不稳 定。(图3:像Microtech Gefell这样的高端话筒制造商非常耐心细致地测试话筒配对。)
实际上在普通的X-Y制立体声配对中也会出现同样的声像错误,就是在话筒由左边旋转到右 边的时候,导致定位不准,声像模糊。那听起来明显很差劲。
对于话筒特性来说,空间摆放并不是十分受人争议,因为由极性特性所导致的电平差异,这 在立体声声像定位上启不了决定作用。但是如果它们有不同的频响,那么你还是要忍受不习 惯、不稳定的声像之苦。
人为使用不同话筒的立体声技术是统一的M&S编排--但是那需要一支话筒有心型指向特性。 即便如此,如果要得到准确的声像,更为重要的是两支话筒必须有相似的频响。除此之外, 匹配不好还会导致不稳定的声场宽度,不仅仅是声像漂移,那基本无法去听。
问:我需要两个S/PDIF输入么?
如果你有两套设备需要经由S/PDIF来连接到你的电脑接口,这需要两个S/PDIF输入么?我 只是奇怪许多声卡却只有一个S/PDIF输入和输出。
Mike Senior:
把多套拥有S/PDIF输出的设备连接到同一个设备上的问题在于所有设备的数字时钟需要被 同步,否则会带来很多数字削波。即便是拥有两个S/PDIF输入的声卡也必须拥有字时钟输入 和输出来同步它的两个输入源,或是和内部的采样率转换相一致。好的采样率转换器并不便 宜,也不容易实现,所以许多一般的声卡(包括很多硬件录音设备)都没有配备它。这就是 你为什么只找到了一对S/PDIF输入输出的原因,那没有字时钟输入输出。(图4:Roland公司 的M1000数字混音器允许你联合多个S/PDIF信号)
你也可以把多个设备通过一个S/PDIF输入送进电脑,首先信号必须被混合在一起,但要注意 混合后的信号是否过载。也还有一些不同的设备可供你使用。我马上可以想到的就是Roland 公司的M1000数字混音器和Mutec公司的智能路由器(SmartMerge router)。尽管它们会稍有 不同,但这足以解决问题,为你提供所需的采样率转换。
如果你只是想在两个源设备间转换而不想插来插去的,智能路由器也包含了这个功能。你可 能真正想要找的是一个单独的数字源交换器。
请问UAD-1效果卡的延迟是如何计算的? 答:UAD-1的延迟是让大家有点找不着方向,我根据一些官方资料为你整理一下它具体的计 算方式,但根据电脑配置的差异,声卡性能的好坏,多少会和计算结果有所出入,相信这些 你也是可以理解的。好,言归正传。
UAD-1效果卡latency(延迟)计算公式如下:
(TL) = (NP) x (SL) x 2 + (SL) (TL) - 总延迟(也就是我们要得出的延迟) (NP) - 使用在音轨上的UAD插件数 (SL) - 你系统(声卡)的延迟
如果你的声卡运行在64个采样延迟下(即1.4毫秒的延迟),当你添加一个压缩器的时候, 计算如下: 总延迟= 1 x 1.4 x 2 + 1.4 = 4.2毫秒
如果你再添加第二个插件,比如混响,计算如下: 总延迟= 2 x 1.4 x 2 + 1.4 = 7毫秒
当然,如果你的声卡延迟为10毫秒,添加两个UAD插件后,总延迟如下: 总延迟= 2 x 10 x 2 + 10 = 50毫秒