论文部分内容阅读
当前电视行业的热点是4K,但话题大多集中于视频质量,很少提及支持图像的音频。
对4K电视的音频很少提及的原因是它还处于新生期。目前没有准确定义4K音频的标准,但ATSC和SMPTE等组织现正在着手处理技术要求,而杜比、DTS、弗劳恩霍夫研究所及其它厂商正在解决该链条的创作和消费端问题。非常清楚的是标准组织和厂商们的所有努力都是为了使4K音频体验既有沉浸感又有个性化,而这些目标以基于对象的音频为中心。
杜比ATMOS
基于对象(又称面向对象)的音频已用于游戏好多年,但由于杜比Atmos的推出,它成为媒体行业的重大新闻。此格式为电影开发,但打算用于家庭,旨在为电影观众建立一种全包围的音频体验,做法是除了在前墙壁、边墙壁和后墙壁外,还在天花板内放置音箱。基本的9.1声道环绕层负责影院前面,而118个音频对象被置于或全面布置于室内其它一切地方。这些音频对象可能包括完全混合的音频声道,但更可能是独立或特别分组的声音,取决于在(最多)64个可寻址的音箱的任意一个需听到的电影中任何特定点的内容。在这在影院内建立令人难忘的体验的同时,现在正在进行的举动是采用和实现NHK开发的22.2环绕声平台,把这种沉浸式音频体验带给听众。
把24个声道的音频传输到家庭可能是一个挑战,但远远不及克服在客厅布置24个音箱那样的挑战。最近颁布的HDMI 2.0规范由于其支持32个通道音频以及此规范在管道内有足够的带宽(这些通道的每一个都能在48kHz传输音频),可以解决传输链的消费端难题。不过,音箱数是所有推动沉浸式音频的组织意识到难题的重要事项,因此他们提出了各种达到相同的结果但不把客厅变成音箱演示间的解决方案。这些解决方案五花八门,从客厅角落天花板上悬挂式音箱到下面的条形音箱和围绕电视屏幕的框式音箱以及用于个人聆听的环绕声头戴式耳机。奇怪的是,在付出所有这些致力于产生音频沉浸感的努力后,最终结果却依然希望被缩混,以便兼容在5.1、立体声乃至单声系统上播放。
定制音频
个性化实际上可能最令人感兴趣,而且最可能履行音频对象对电视的承诺。由于一个对象可能是节目内任何一段音频,家庭听众可以有与内容创作者允许的一样多的节目音频控制。把解说声道转变为音频对象意味着听众可以把主解说员交换为本地语言或主队的解说员,无需改变混音内其它任何东西。如果听众分辨语音有困难,他们可以提升语音轨音量超过背景声,或者如果他们想体验无解说的比赛,可以静止语音。描述性视频服务或特别评论节目用同样方式很容易提供。当然,所有这些定制能力要求内容创作者和消费者有新设备以及一些控制方式,最可能是扩展的元数据,这将需要适当的编写和传递到家以便系统起作用。
把音频对象引入制作过程无疑意味着工作流程的改变,需要管理更多的音频源和新元数据,但这还不是将感觉到它们的影响的唯一方面。音频室将需要有容纳此格式要求的更多音箱的物理空间,此空间还必须适应来自如此多的声源的恰当声成像。这意味着广播机构和制作机构将需要为音频室分配更多的设备空间。后期制作系统可能需要更强大的工作站,有更多的DSP和输出母线以便处理和传输制作可能产生的大量对象。我们甚至可能看到调音台重返电视音频后期制作间,就是为了处理复杂的音频对象的传送和声像。
现场活动制作期间建立沉浸式音频体验将要求一致完全重新想象的工作流程,并且可能意味着由于移动车混音空间的物理限制,现场混音器将发送一个环绕声混音及其它音频源到一个有更好听音环境的制作间,在那里真正汇编为最终的沉浸式混音。把全部这些声道从现场发送到制作间可能要倍增所需的传输路径数量。对于演播室内节目制作,如果不布置更多的话筒或引入预制作的背景音响效果到节目内,可能很难营造一个沉浸式环境。
随着电视业巨头把沉浸和个性化推到前沿,音频对象似乎是一个未来几年我们都将更深了解的技术,但它实现的广度和程度将取决于创作者和广播机构有多愿意用此新技术制作内容。消费者是否将接受伴随其视频一起来的沉浸或个性化音频也有待观察。决定可能最终取决于现有的问题和复杂性是得到解决还是被此新技术搞得更糟。
对4K电视的音频很少提及的原因是它还处于新生期。目前没有准确定义4K音频的标准,但ATSC和SMPTE等组织现正在着手处理技术要求,而杜比、DTS、弗劳恩霍夫研究所及其它厂商正在解决该链条的创作和消费端问题。非常清楚的是标准组织和厂商们的所有努力都是为了使4K音频体验既有沉浸感又有个性化,而这些目标以基于对象的音频为中心。
杜比ATMOS
基于对象(又称面向对象)的音频已用于游戏好多年,但由于杜比Atmos的推出,它成为媒体行业的重大新闻。此格式为电影开发,但打算用于家庭,旨在为电影观众建立一种全包围的音频体验,做法是除了在前墙壁、边墙壁和后墙壁外,还在天花板内放置音箱。基本的9.1声道环绕层负责影院前面,而118个音频对象被置于或全面布置于室内其它一切地方。这些音频对象可能包括完全混合的音频声道,但更可能是独立或特别分组的声音,取决于在(最多)64个可寻址的音箱的任意一个需听到的电影中任何特定点的内容。在这在影院内建立令人难忘的体验的同时,现在正在进行的举动是采用和实现NHK开发的22.2环绕声平台,把这种沉浸式音频体验带给听众。
把24个声道的音频传输到家庭可能是一个挑战,但远远不及克服在客厅布置24个音箱那样的挑战。最近颁布的HDMI 2.0规范由于其支持32个通道音频以及此规范在管道内有足够的带宽(这些通道的每一个都能在48kHz传输音频),可以解决传输链的消费端难题。不过,音箱数是所有推动沉浸式音频的组织意识到难题的重要事项,因此他们提出了各种达到相同的结果但不把客厅变成音箱演示间的解决方案。这些解决方案五花八门,从客厅角落天花板上悬挂式音箱到下面的条形音箱和围绕电视屏幕的框式音箱以及用于个人聆听的环绕声头戴式耳机。奇怪的是,在付出所有这些致力于产生音频沉浸感的努力后,最终结果却依然希望被缩混,以便兼容在5.1、立体声乃至单声系统上播放。
定制音频
个性化实际上可能最令人感兴趣,而且最可能履行音频对象对电视的承诺。由于一个对象可能是节目内任何一段音频,家庭听众可以有与内容创作者允许的一样多的节目音频控制。把解说声道转变为音频对象意味着听众可以把主解说员交换为本地语言或主队的解说员,无需改变混音内其它任何东西。如果听众分辨语音有困难,他们可以提升语音轨音量超过背景声,或者如果他们想体验无解说的比赛,可以静止语音。描述性视频服务或特别评论节目用同样方式很容易提供。当然,所有这些定制能力要求内容创作者和消费者有新设备以及一些控制方式,最可能是扩展的元数据,这将需要适当的编写和传递到家以便系统起作用。
把音频对象引入制作过程无疑意味着工作流程的改变,需要管理更多的音频源和新元数据,但这还不是将感觉到它们的影响的唯一方面。音频室将需要有容纳此格式要求的更多音箱的物理空间,此空间还必须适应来自如此多的声源的恰当声成像。这意味着广播机构和制作机构将需要为音频室分配更多的设备空间。后期制作系统可能需要更强大的工作站,有更多的DSP和输出母线以便处理和传输制作可能产生的大量对象。我们甚至可能看到调音台重返电视音频后期制作间,就是为了处理复杂的音频对象的传送和声像。
现场活动制作期间建立沉浸式音频体验将要求一致完全重新想象的工作流程,并且可能意味着由于移动车混音空间的物理限制,现场混音器将发送一个环绕声混音及其它音频源到一个有更好听音环境的制作间,在那里真正汇编为最终的沉浸式混音。把全部这些声道从现场发送到制作间可能要倍增所需的传输路径数量。对于演播室内节目制作,如果不布置更多的话筒或引入预制作的背景音响效果到节目内,可能很难营造一个沉浸式环境。
随着电视业巨头把沉浸和个性化推到前沿,音频对象似乎是一个未来几年我们都将更深了解的技术,但它实现的广度和程度将取决于创作者和广播机构有多愿意用此新技术制作内容。消费者是否将接受伴随其视频一起来的沉浸或个性化音频也有待观察。决定可能最终取决于现有的问题和复杂性是得到解决还是被此新技术搞得更糟。