当前位置:首页>家庭维修>音响>

音响输出功率怎样计算(音响额定功率计算公式)

音响输出功率怎样计算(音响额定功率计算公式)

更新时间:2021-12-11 19:08:16

音乐圈的人相信都有听过 “Loudness War” 响度战争这个名词,响度战争追溯它的源起,也许早在1950年代,点唱机 (Jukebox) 流行的年代,就已开始,但受限在模拟唱盘无法承受过大音量,极易因过大音量而无法播放,所以当时问题还不太大。约在80年代晚期,CD 这种数字载体出现,没有模拟载体的某些限制后,问题便慢慢浮现,渐趋白热化。为什么会有这种现象?我觉得是种人性,数字化后,因为传输或处理都较模拟干净不失真,整体音量就可往上再提升,加上客户端都想要自己的音乐上电台电视台比别人受瞩目,于是声音顶到音量表顶端,压到表头都不太会动的事就渐渐成常态 (可上网搜寻Loudness War、Metallica“Death Magnetic” ) 。听众被迫听这样的声音,直到某一天,大家受够了这种没动态,甚至失真的音乐,或是听广播看电视不时被爆出的广告惊吓到,要不停地调整音量后,问题才终于被重视。怎样去控制节目或音乐之间的音量,让聆听过程较为舒适愉悦?2006年7月ITU(International Telecommunication Union国际电信联合会) 提出了一份对于节目响度与真实峰值 (True Peak) 的建议书 ITU-R BS. 1770 ,这份建议书是因应听众希望不同来源、类型节目在音量上有一致性,并为单声道、立体声及多声道节目音讯,提供一个制作时的参考,响战争开始有个方向可解决。

什么是响度?

响度是一种人耳对于音压大小改变的感知程度,它跟音量是两个不同的概念。音量是种物理上可量化的电压或气压数值,而响度是人耳对这些物理性声音变化的主观感知,涉及的不只是物理声学,还有心理声学方面的研究。因为传统物理性的音量表无法表现出人耳对声音大小的感知,响度战争的热化让人开始思考有什么方式可以让声音媒体播放时,能够维持一致性,终结响度战争。

让声音大小均一化有两种方式:Peak Normalization (峰值均一化) 和Loudness Normalization (响度均一化) 。

图左为以各节目最大峰值去做均一化,绿色上限为平均音量,红色为整体响度,黄色上限为最大峰值,对齐了最大峰值后,因为各种类型节目的动态范围不同,须保留的余裕空间 (headroom) 也不同,因此平均音量或响度是没法达到一致,听起来音量大小还是差异甚大。早期广播电视播出是采用峰值均一化处理,不管节目内容是什么,全部自动调到峰值是相同的,常常造成了安静或无声的段落会慢慢加大,于是观众就听到底噪的空调声,等到其他声音出现才又慢慢听不到空调声。而因为当时的媒体用最大峰值均一化来统整不同节目播出,同一峰值下压缩程度越大的,听来起会比别人大声,因而造成响度战争

图右则是以各节目用整体响度去做均一化,音量上达到一致,各种类型节目的最大峰值也不受影响,也就是现在我们在讲的响度控制。

谈到最大峰值,过去数字音频系统所采用的音量表,多数是 “Peak- Sample” 峰值取样表,而非 “True- Peak“ 真实峰值表。峰值取样表的问题就在于真正音量峰值出现处,不见得刚好在取样点上,有可能在取样点中间,所以表头看起来没亮over红灯,实际上失真却已出现。为了更正确地表示音量,ITU建议使用真实峰值表会比峰值取样表来得准确,至于真实峰值表是如何测量音量的,有兴趣的人可去查阅ITU-R BS.1770建议书。

在没有响度表前录混音等,都是要靠录音师敏锐的听力加上目视音量表来维持音量一致,但响度是主观的,要怎样才能有个客观的方式来量测主观的认知?为了解决这个问题ITU-R BS.1770文件提供了一个较客观又简单的音量测量方式。下图为ITU-RBS.1770响度四阶段处理法 :

一、首先声音会先经过所谓的K-weighting filter (Kweighting filter跟Bob Katz发明的KSystem没有关系) ,这个滤波器分两段式滤波。

第一段先模拟人的头部,先在讯号上加个坡架型均衡器 (Shelving EQ) ,强化2kHz以上高频,然后第二段再用二阶高通滤波器 (2nd Order High PassFilter),减去约100Hz以下低频,两段式的滤波就叫K-weightingfilter。

合起来的完整K-weighting Filter如上图。

二、将经过滤波器处理后的各轨音讯功率作均方计算。

三、各音轨加权后加总 (如果是5.1声道的话,环绕声道加权值较大,LFE重低音声道不列入计算) 。

四、各音轨的输入讯号以每400ms为周期做均方计算 (重迭75%) ,每100ms更新数据一次,低于-70LUFS的数值会被排除,数值比前面的低10LU也被排除。

(请参考ITU-R 1770-3附录1)

*注意原始文件是以48kHz的音讯去做计算,取样频率不同,演算得出来的数值也会不同。

重要响度名词

LUFS (Loudness Units Relative to FullScale) :对应于数字满刻度 (dBFS) 的响度单位,欧洲EBU采用这名词。

LKFS(Loudness K-weighted relative to FullScale) :对应于数字满刻度的K加权响度单位。美国的ATSCA/85采用这名词,事实上LUFS跟LKFS完全相同,只是不同区域的称呼不同。

LU(Loudness Unit) 响度单位:测量响度的单位,1LU= 1dB。

I(Integrated Loudness) 整体响度:整段节目长度 (从开始至结束测量) 总合计算出的响度。

S (Short-term Loudness) 短期响度:测量过去3秒钟内的音讯响度。

M (Momentary Loudness) 瞬间响度:测量过去400毫秒内的音讯响度。

LRA(Loudness Range) 响度范围:测量整段节目 (同Integrated Loudness长度) 内,最小与最大响度间的差距,以LU为单位。

Crest factor峰值因子:也叫做peak to average ratio,指的是一个音频讯号最高峰值到RMS均方根平均值之间的差异,以dB表示。

dBTP(Decibel True Peak) :参考dBFS表,以over-sampling方式来重建声音讯号波型,避免最大峰值出现在取样样本间的问题 (inter-sample peak) ,正确表示真实峰值的数字音量分贝表。

Sample Peak:一般常见的数字取样峰值表,缺点是忽略了最大峰值出现在取样样本之间的可能性,造成音量看似未破表,实际上却已失真。

Peak Normalization峰值均一化:不同曲目、节目用最大峰值音量来对齐默认的音量参考值。过去采用这种方式来统一音量,易造成追逐比别人大声醒目,而在混音时过度压缩声音动态,让声音听起来更大声,形成响度战争。

Loudness Normalization响度均一化:以响度来衡量声音大小,制定一个参考数值,让所有节目或曲目对齐这个响度值。优点是保留了一定的headroom (余裕空间) ,鼓励声音要有动态。

Target Loudness Level目标响度值:设定整体声音响度所要达到的均一值。

目前各大串流平台上传音乐规范

接下来我们来看看常见的串流音乐平台所采用的响度参考值,以及如何处理上传音乐的动态。

首先必需说明一下,除YouTube外,上列串流音乐平台多数都有自动音量调整 (audio normalization) 功能,在设定里都可找得到,你可以选择要不要用,若是选择使用,程序便会在播放音乐时,将音量调整到默认的响度参考值上。

图:iTune播放器

图:Spotify播放器

上传音乐至串流平台后,系统会去测量单一曲目或是整张专辑的整体响度值,也就是看响度表上的I值大小。采用整张专辑去测响度的方式,比较能完整呈现母带后期处理后的原貌;单一曲目测量就是视每首歌曲为独立个体,方便维持随机播放或自定义列表时的音量,少了整体专辑的一致感与艺术性。

有几点要注意的:

1. 除YouTube外,多数音乐串流平台在播放设定里面都可选择要不要启动自动音量调整功能,如果选择启动,音乐就会根据各平台制定的响度参考值去做曲目或专辑的音量调整,均一化到参考值左右。必须注意的是:响度超过参考值一定会被降下,但响度未达到参考值时,有的会加大,有的不会。

2. 注意上传音乐的最大峰值。

假设平台是会自动调整音乐响度大小,现在有一首歌,测出它的整体平均响度为 -16LUFS( I值),最大峰值为 -3dBTP,要传上响度参考值为 -14LUFS的串流平台,因为响度低于参考值2LU ,所以系统会整首自动加大 2dB ( 1LU= 1dB) ,让它的平均响度达到 -14LUFS,而它的最大峰值也会跟着加大到 -1dBTP。

如果曲子的整体响度是 -12LUFS,最大峰值为 -3dBTP,平均响度高于参考值2LU,上传到这个平台,自动音量调整就会将曲子降低 2dB播放,它的最大峰值也就会从 -3dBTP降至 -5dBTP。

降低音量比较没有问题,问题就出在调高音量时。假设要上传平台播放的音乐整体响度是 -16LUFS,而混音时做到的最大峰值为 -1dBTP,上传到响度参考值为 -16LUFS的Apple Music不会有什么问题,但上传到响度参考值为 -14LUFS的Spotify就有问题了。Spotify的自动音量调整会调大2dB,原来是 -1dBTP的最大峰值再上调2dB就超过数字音量表最大的0dBFS值,造成clipping失真。

现在多数平台为了防止响度较小的音乐在往上调升响度时,造成峰值破表失真,多有因应策略。有的平台对于小于参考值的音乐不做任何调整,有的是设定最大峰值限制,确保音乐不因加大响度而失真。举例来说,有首曲目的整体响度是 -20LUFS,峰值为 -5dBTP,放上响度参考值为 -14LUFS、最大峰值 -1dBTP的平台时,理论上平台自动音量调整应要将整首歌上调 6LU,但因最大峰值的限制,平台只会调成 -16LUFS的大小。

3. 是否有预设限幅器(Limiter) ?

其实多数串流平台目前都没有放limiter,理论上万一经过自动音量调整后,最大真实峰值没抓好,你的音乐就会出现爆音。(请注意:做完mastering后一定要用有True Peak功能的音量表确认峰值位置。) 不过事实不是这样,上一点提到的最大峰值限制里有做说明。

要特别说明一下Spotify已在2020年底更改过它的处理方式,现在的Spotify已采用ITU-R BS.1770测量响度,并拿掉了放在一般播放模式的Limiter。Spotify现在Premium用户可以选用三种聆听模式:Loud (-11LUFS) 、Normal (-14LUFS) 、Quiet (-23LUFS) ,只有使用Loud模式时,才会加上Limiter。会有Loud模式是为了方便在吵杂环境听音乐的人,压缩动态让响度提升,避免背景噪音太大而听不清楚。

4. 因为各平台采用的编码方式(Codec) 不同,如果是使用有损压缩编码 (lossy codec) ,像是 MP3 、WMA、AAC、Ogg vorbis,编码的过程中也可能造成峰值增加,产生失真,所以最好在送母带上各平台时,使用一些工具 (如Apple Digital Master Droplets、NUGEN的 Master Check等等) 测试是否会有失真产生。

响度控制真的解决问题了吗?

先说明一下为什么我不用响度“标准”这个词,其实口语上大家都懂,不过原文就是reference,它只是个建议,并未强制规定音源上传一定要在数值上。如一开头所说,响度是主观的,人耳听觉本就不是一个能标准化的东西,低频永远是个最不准的地带,如果音讯低频声音比例占多数,低频能量大,不只是一般音量表上会占大部分空间,响度表也是,明明响度已超过参考值,但耳朵听起来就是不够;人耳最敏感的 2~5kHz情形刚好相反,如果音讯这个频段的声音居多,耳朵告诉你音量大小一样了,但响度表却显示未达到参考值。

图:Fletcher-Munson等响曲线

根据Equal Loudness Contour (等响曲线) ,人耳对高低频较不敏感,对2~5kHz较敏感。响度表毕竟只是模拟人耳的听觉,但还是有些不同,所以广播电视节目在录制节目时,还是以人耳为主,响度表为辅;串流音乐平台方面只能靠自动音量调整去把差异减小,由于每首歌曲的频率分布不一,所以即便开启自动音量调整,听起来仍有些音量差异。

另外像是器乐的独奏或较轻柔的乐曲要跟磅礡的马勒交响曲放在前后首播放,响度调到接近时,你会有什么样的感受?想象一下。不同的音乐类型会有不同的动态范围,把独奏乐器变成跟交响乐团同等大声摆在一起,听起来也很奇怪。尽管响度自动控制可以帮助我们快速地达到大小声平均这件事,但实际上也不是完美的,因此有的平台采用以专辑来测整体响度,这样至少保有了原来专辑母带设定的大小声及艺术性。

综合来说,使用响度控制抑制了响度战争,也保留音乐/节目应有的动态范围,尤其对广播电视播出系统来说,解决了长期以来广告商为了想让自家广告突出,使尽方式要混音师把音量变大,甚至不惜让声音破掉的不合理要求。有了响度控制后,即使混再大声,最后都会被拉下音量跟别人一样,而且因为动态被压缩到极小,拉到同等响度时,反而显出声音失真、扁平无趣的缺点。

母带后期处理要如何看待响度参考值

母带后期处理不只是把音量拉大,加亮高频这么简单,影响响度最大的还是混音阶段,混音必须取得良好的频率分布及音量、动态平衡,将来做母带后期处理时,才有办法处理的更漂亮,呈现出最佳的成品。

对于母带制作时,到底要不要考虑各平台的响度参考值呢?多数的母带工程师都觉得要回归音乐本质,尽力做出最好听的音乐,这才是重点,至于各家平台采用哪种方式调整音量,就让平台去处理,母带工程师不太可能为了众多平台一个一个去做出符合他们规格的母文件,而且规格随时可能会改变。尽管如此我们还是要去了解这些串流音乐平台的规格,注意一下响度均一化后的安全动态范围。若是要转成有损格式,可先行转档,避免平台转文件编码不佳,或因转档而峰值失真的问题产生。

来自vocus

,