感觉真是玄乎。要是反过来,从声音的频率幅度出发去讲,可能会容易记住一些。
首先借用一句广告词——你能听到的历史:133年。
没错!自1887以来,声音的记录与传播伴随着科技进步日臻完美。但是,圈里总是有一些“高”人“高”论。这类“高”论的特点是:论述人永远无法用科学理论自圆其说,极力回避与否定用电子测量设备测试客观指标和用双盲听测做主观对比,自始至终用“用耳朵收货,你听过就知道了”,“你对比过就知道了”,“听不出那就是木耳”这样的话解释与回复一切质疑。
为什么要极力回避与否定用电子测量设备测试客观指标呢?因为电子测量设备是照妖镜!加之重复性、再现性这六字真言,转瞬之间现原形啊,嘿嘿。
如果真的说用耳朵收货,那么实践是检验真理的唯一标准,双盲测试,是去伪存真的唯一途径。现实是,你敢么?
电子元件与电声器材,性能指标上的差距是客观存在的,人耳是否能客观地加以区分呢?说清楚这个事,要从一个名词dB(分贝)说起。
1、dB是什么,什么是dB?
简单的说,d是d,B是B,d与B是2回事
d是deci,是国际单位制词头,10-1,1/10的意思
B是个单位缩写,写全了是Bel(贝尔),这是个人名,就是下面这位,AT&T 和贝尔实验室的创始人、美国电话专利的持有人,Alexander Graham Bell。
dB么,是个缩写,是十分之一个“贝尔”的意思,中文名“分贝”。
划重点,d是分数词头一定小写 ,B是人名一定大写,这个写错印错成DB,db,Db的基本不是笔误,而是不懂。
2、dB的诞生
19世纪末,“电话公司”面世,为衡量电信号传输的损失,美国电报电话公司(AT&T)和英国邮政局开始使用“标准线材英里数”MSC(Miles of Standard Cable)作为单位。该单位以 795Hz 信号为测试信号,以每英里 88Ω、19AWG 直径的电话线作为“标准线材”,并计算损失比例。1 个 MSC 大概在 0.86,也即发送 1000W,一英里后剩 860W;如果传输 2 英里,就是 860x 0.86W ,相当于 1000W x 0.86 的 2 次方,因此英里数可以看成是幂指数。3 英里是 0.86 的三次方、4 英里就四次方。早期没有中继设备,传输极限是 46 英里,1000W 传输 46 英里后剩下 1W(0.86 的 46 次方)。由于 MSC 的规定很多,加上各国温度和线材不同,各国的数值略有差异;最关键的是,MSC 是英里数(大概 1.6 公里)。
德国/法国用的公里(法国人打死不用英里)。1924 年,AT&T 与欧洲“长距离电话国际委员会”决定统一标准,采用新的国际单位 TU (Transmission Unit),英里和公里都站一边,频率、阻抗和线材也不规定,各国可以有自己的规格。委员会只规定功率比例对应的指数,为方便计算,指数以 10 为底,即“10的n次方”。委员会又给这个n起了个高逼格的名字:“Bel/贝尔”,缩写“B”。很快,委员会又发现了“B”是一个变化幅度很大的单位,于是增加了一个“deci-Bel”即dB/分贝。不幸的是Bell 先生逝于 1922 年,并不知道自己在两年后被代表了。
3、第一个公式
\[\frac{P}{{{P_0}}} = {10^n}\]
其中 P0是原始功率,P是末端功率。
如果原始功率 1W,末端放大为 10W,是原来的10倍,即10的1次方,n=1这就是1B即 10dB
如果原始功率 10W,末端衰减为1W,是原来的-10倍,也就是10的-1次方,n=-1。这就是-1B即 -10dB
dB只是比例大小,换句话说,知道了dB,其实并不知道功率有多大,除非有一个参考,例如原始功率P0。假如P0被强行规定为某个确定的功率,那么就可以用dB来表示绝对功率的大小。这种用dB表示的绝对功率,称为电平值,简称Lp(Level powers):
\[\frac{P}{{{P_0}}} = {10^{\frac{{Lp}}{{10}}}}\]
反过来取对数,Lp的公式就是:
\[Lp = 10{\log _{10}}\frac{P}{{{P_0}}}\]
划重点,“dB”只是衡量比例大小的参数。它不表示电压、电阻、功率的具体值,它只表示放大或缩小了多少倍。要想用dB表示绝对功率,必须规定P0。
4、dB (A) 或 dBA
1933年,贝尔实验室的 Fletcher 和 Munson 发现:有时音量大一倍(6dB)但听起来并没有大一倍。这就是人耳的“等响曲线”也叫 Fletcher-Munson 曲线(1937年拟定)。这个测量很复杂,在多个国家的努力下,直到1960 年代才由 BBC 确定最终标准,经过等响曲线校准的分贝值,我们把它叫做:dB (A-weighted/A-加权)缩写成 dB (A) 或 dBA。这个单位同样是与电压/电阻等没关系,仅仅是人耳对声音的声学校准。(权即由测量值精度的不同在平差计算中所取的权重不同。精度越高,权越大。“加权”的意思就是“乘以权重”,即“乘以系数”的意思)
加权弱化了极限频率的干扰(这部分正是设备吃力的,尤其超低频),dBA 数据会比正常数据更“好看”,现在即使很多厂商写“dB”,其实都是“dBA”,但如果你看到有厂商在数据后标注“un-weighted/未加权”字样,那是业内良心。
5、多变的dB
dB 是个相对值,仅代表比例,有不同的单位为基准,dB 才具有实际意义。
dBV
“V”是伏特的意思,是电压的单位。德国最早采用dBV,定义V0=1V,因此,1V = 0dBV。
由于:
\[1{\rm{W = 1}}\frac{{{{\rm{V}}^2}}}{\Omega }{\rm{ = }}1{{\rm{A}}^2}\Omega \]
因此:
\[10{\log _{10}}\frac{P}{{{P_0}}} = 10{\log _{10}}\frac{{{V^2}}}{{V_0^2}} = 20{\log _{10}}\frac{V}{{{V_0}}}\]
划重点:
电压放大倍数 = 功率放大倍数开方。
例如
6dB ≈ 4 倍功率 ≈ 2 倍电压 = 2 倍音量
而
12dB ≈ 16 倍功率 ≈ 4 倍电压 = 4 倍音量
20dB = 100 倍功率 = 10 倍电压 = 10 倍音量
由于电压和音量对等,所以 dBV 很直观。例如某 DVD 播放器的最大输出电平(MOL,Maximum Output Level)是 4V(+12dBV),而另一台播放器输出电平是 8V(+16dBV),那第二台播放器的最大音量是第一台的 2 倍,最大功率是第一台的 4 倍。
dBu
30 年代是广播行业的起步阶段,贝尔实验室、CBS(哥伦比亚广播公司)和NBC(美国广播公司)联合研发一种防止音量超标的设备:VU 表(Volume Unit/音量单元)。
1939 年,VU 表的标准制定完毕,与 1937 年德国人发明的 PPM(峰值电平表,以电压 dBV 为单位)不同的是,美国人决定用——功率作为单位。
定义:0dBm = 1mW = 0.001W
即P0=1mW,VU 表的“0”代表 0dBm。
为什么不用电压?因为贝尔实验室是基于人耳听力进行开发的。那时美国广播行业的阻抗标准是 600Ω,因此我们可以算出0dBm 对应的电压:
V 2 = 0.001W x 600Ω, V ≈ 0.775V
0.775V 成了美国广播设备的最大输出电压标准。
为避免欧洲标准混淆,记作:
0dBu = 0.775V
即以0.775V作为V0。
二战后,美国广播行业发现:电平表本身的电路对功率有点影响,于是将0VU微调为+4dBu≈1.23V。换句话说,直接在表盘上减了4。
由于美国战后拥有绝对的话语权,+4dBu 在广播/扩声/录音圈一统江湖。
dBV 和 dBu 开始只是国家标准的不同,后来怎么就成了民用/专业的区别?
原因么,那个时代+4dBu 对元器件要求高,-10dBV 可是使用便宜的元件和材料,效果也不错,但从专业角度看,模拟时代高电压对音质一定是有利的。
结论:
0dBV = +2.22dBu 或者 0dBu = -2.22dBV
+4dBu 比 -10dBV 大多少 dB?
由于
+4dBu = (-2.22 + 4)dBV = +1.78dBV
所以
+4dBu - (-10dBV) = (1.78 + 10)dB= 11.78dB
由于12dB ≈ 16 倍功率 ≈ 4 倍电压 = 4 倍音量,因此民用和专业的音量标准相差 4 倍。
dBFS
我们谈论数字产品的参数时,如信噪比/动态范围、底噪、谐波失真、互调失真等,这些参数通常以百分比显示,但可以转化为dB的,这时候我们说的dB其实是dBFS,即“dB Full Scale (全标度)” 这是随着数字音频技术的发展而产生的新概念(1977 开始使用,CD在1982 年面世,这之前大家没有“数字音频”的概念)。
dBFS 与 dBu/dBV 不同的是,dBFS 有最大值:即0dBFS,相当于100%。但它没有最小值,它可以无穷小。它的意义是能记录的声音最小细节,dBFS 越小,能记录越小的声音,即细节越多。
0dBFS 有多大?这不一定,取决于厂商怎么设计,会在资料中给出明确数据。
例如:0dBFS = XXdBu
专业声卡基本是+6dBu 起,旗舰品通常+24dBu,通常越贵越高。
数字音频技术的核心是将声波波形转换为二进制数据,实现这个步骤使用的设备是模/数转换器(A/D),工作原理是:以每秒若干次的速率对声波进行采样,每一次采样都记录下了原始波形在某一时刻的状态,称之为样本,将一串样本连接起来,就可以描述一段声波了。每一秒钟所采样的数目称为采样频率或采率,单位为Hz(赫兹)。由此可见,采样频率越高所能描述的声波频率就越高。 (注:根据采样定理,用两倍于一个正弦波的频繁率进行采样就能完全真实地还原该波形,因此采样频率直接关系到它的最高还原频率指标。例如,用44.1KHZ 的采样频率进行采样,则理论上可还原最高为22.05kHZ 的频率,这个值略高于人耳的听觉极限)。
对于每个采样,表达振幅的大小的级数是有限的,比如1024级。用二进制表示时,1024级需要10位二进制数,称之为采样分辨率或采样精度。每增加1bit,能表达声波振幅的状态数就翻一翻,即6db 的动态范围。可以计算出16bit 能够表达65536 级,即能够记录-96dBFS 幅度的细节,dBFS 通常人们都直接叫“dB”(注:-96dB已经超过人耳的极限了,听力是从一出生就开始下降的,小孩的耳朵大概能听到 -90dB,而30 岁以后能听到 -80dB 已经不错了)。16bit/44.1kHz、24bit/48kHz、24bit/192kHz 分别代表什么应该明白了吧。
超过 0dBFS 怎么办?——直接“削波”,就是强行把超出的波形削平,此时播放器或声卡的电平表冒红,显然要避免这种状态。(如果超出一点,听起来可能不太明显,如果超出太多,波形会变成类似“方波”的大段噪音)。
“动态范围”和“信噪比”有啥区别?动态范围通常是“绝对底噪”或“AD/DA 芯片底噪”,例如 -120dB 动态,意味着不会记录 -120dB 以下声音(全是噪音)。信噪比可以看成“实际底噪”或“模拟电路底噪”。民用厂商有时两个值相差巨大,但专业厂商习惯把两个数值做成一样,因此专业厂商通常不写“信噪比”,它们说动态范围就是信噪比。
dB SPL
dB SPL 是衡量真实震动大小的单位。
“SPL” 是 Sound Pressure Level 缩写,中文称“声压级”。
ANSI(美国标准协会)定义 20μPa 为 0dB (SPL) ,20μPa 大约是人耳听力极限。
声压级的计算与电压公式是一样的。即:
距离缩短一半=声压增大一倍=2 倍音量≈ 6dB ≈ 2 倍电压
音箱上一般都会标注Maximum SPL@1m:XXdB,即在额定功率推动下,距离音箱1 米处的最大声压(级),这里所说的“dB”,即dB SPL。
在扩声音箱和耳机行业我们还经常看到以 dB 为单位的“灵敏度”,这是“功率的效率”,其中扩声音箱灵敏度是“1W 功率”能达到的声压,耳机灵敏度是 1mW能达到的声压。
最后了解不同场景的声压:(1 μPa = 0.000001 Pa)
关于dB(A)的补充
厂商数据大部分都经过“等响曲线”校准,有的标 dB(A)、A-Weighted,有的不标。
这条曲线大概是这个样子:
红线就是“等响曲线”,即这条曲线上听起来一样响。
例如 70dB SPL 的 20Hz 正弦波与2dB SPL的 1000Hz 正弦波,两者听起来音量/响度一样。很明显人耳对超低频/超高频都不敏感,最敏感的是 3000 ~ 4000Hz,这时把测得的曲线反过来补偿就可以了:
但还没这么简单,从等响曲线图你能看到,不同音量下,红线的斜率不一样,例如 90dB 的 20Hz 正弦波和 20dB 的 1kHz 正弦波一样响,但 100dB 的20Hz 正弦波响度相当于 40dB 的 1kHz 正弦波。也就是说人耳感受不同频率声音的响度区别,还与声音的大小有关。
考虑到不同响度,调制出来的曲线不一样:
室内校准用 A-weighted/A 加权(蓝线)
扩声用声压更大的 C-weighted/C加权(红线)
因为不同响度下等响曲线是不一样的,确定等响曲线时,必须先指明1kHz的响度基准。这个基准用“Phon/方”表示。例如 1kHz 的正弦波如果响度 40dB,那我们就说它是以 40 Phon 为基准来加权。
(本文部分内容取自互联网)
[修改于 3年11个月前 - 2021/01/21 00:54:57]
“等响曲线”反过来是不是就是声音设备的频率响应?
等响度曲线是和声音设备频率响应无关的 即使没有声音设备而是现场听演奏 依然存在等响度效应
最好的监听耳机应该是和创作者使用的耳机一致
不考虑你和创造者的生理区别的话 音量也一致 那么你能听到创造者正想表达的东西
但是通过考虑等响度曲线 可以修改声音设备在不同音量时的频率响应 弥补因为音量造成的感官区别
此外在信息量速率有限的传播中 考虑等响度曲线以及掩蔽效应等 加强和减弱不同的信息的传输量速率 得到针对人类听觉的更好的传输效果
等响度曲线是和声音设备频率响应无关的 即使没有声音设备而是现场听演奏 依然存在等响度效应最好的监听耳...
按道理”真实的声音“应当是创作者听到的自己演奏的声音,而不是创作者真实发出的声音。
所以收音和监听设备不需要考虑人耳的任何非理想特性导致的问题,只需要做到在一个合适宽度的频率范围内保持频率响应平坦。(收听者有与创作者相同的耳朵
如果创作者听到的自己的声音,现场演奏的声音都存在相同的等响度效应,那么含有该效应的声音不就是”真实的声音“吗
按道理”真实的声音“应当是创作者听到的自己演奏的声音,而不是创作者真实发出的声音。所以收音和监听设备...
使用有限声道的方法 是不可能真实重新现场声音的 即使使用专门的声学测量用麦克风也不可能 因为早已失去大量的声音信息 你只能得到某个点各向声压经过某种综合得到的信息
唯一可能的 是使用假人头录音技术 使用塞入耳道的耳机回放 最大限度地模拟听感 但是大多唱片是为喇叭播放进行采集和调音的 (有非常少数假人头录音唱片发售)
目前许多唱片作品甚至并不存在所谓的“演奏现场” 而对声音的编辑调整也是艺术作品的一部分 比如可能需要对原声进行非线性的激励产生更多谐波
你能听到唱片创作者(而不是演奏者)正想表达的声音 即达到了艺术传达的效果
200字以内,仅用于支线交流,主线讨论请采用回复功能。