Featured image of post 为什么 Hi-Res 对消费者来说没意义?

为什么 Hi-Res 对消费者来说没意义?

现在,Hi-Res,即高解析度音频广泛流行,但必须要指出的是,它对于消费者来说并没有实际好处。

Hi-Res,高解析,即高规格,具体来说,就是几倍于 CD 级别的采样率和更大的位深度。下面,我们具体来分析一下采样率和位深度分别起到什么作用,然后我们就能推知过高的规格对消费者无用的原因了。

如果你还不清楚采样率和位深度的基本概念,请务必先阅读前置知识 数字音频基础

采样率

根据采样定理,采样率决定了数字信号能无损失复原的声音的最高频率。CD 44.1 kHz 的采样率,能无损失地复原频率高达 22.05 kHz 的声音。这个值已经高于人类听力的上限了。那么更高的频率人能听到吗?这么说吧,如果你能听到超声波,你绝对会被请去实验室好好研究一番的。

下面,请欣赏视频 强行降低采样率会发生什么?

所以我们可以知道,采样率越高,音频的高频信息保留得就越多,但是,超过人类听力范围的高频信息并没有任何意义。有人说自己放 Hi-Res 确实听到了额外的「超声波」,但其实不是,如果设备确实能忠实播放超声波,你听到的理应是一片寂静;但如果真的有听到声音,那就是设备不行,产生了混叠失真,让超过限度的高频信号折返到听力范围,带来了冗余的声音。想要实际体验,可以看 A Digital Media Primer for Geeks 的 12:00。

位深度

那么位深度决定了什么?我们知道,位深度越大,则采样点的位置就越精确,而如果位深度太低,就会导致重建的波形与原始波形有偏差,偏差带来的结果不是跑调,而是相当于给原始波形额外叠加了一层噪音波形,这层噪音波形就是「量化噪声」。也就是说,你仍能听到音乐,但还会额外感知到量化噪声。

从高位深到低位深讲究算法。有个功能叫抖动(dither),它可使动态范围在不提高位深度的情况下大幅提升,抖动的原理是什么呢?我们以拥有 8 个值的波形为例,记为 1~8,如果波形减小了 20%,则得到以下的新值:

1
0.8  1.6  2.4  3.2  4.0  4.8  5.6  6.4

由于它们不是整数,因而需要重新量化,量化时有不同的方案,比如直接截断,得到:

1
0    1    2    3    4    4    5    6

抑或是四舍五入:

1
1    2    2    3    4    5    6    6

每当波形达到 3.2 这个值,所得结果都会偏离 0.2;而每当波形达到 4,却又不会产生任何错误。在整个波形中,误差的大小会反复且有规律地变化(误差和信号完全相关,比如原值是 6.4,就一定会跑偏 0.4),这种变化导致的量化误差会产生额外的离散频率的声音,这种声音就是一种失真

抖动,便是先增加位深度,在多出来的位深中加入随机噪声,然后再将位深度减回去。如此一来,多出来的声音与原本的波形就没有了相关性,大脑对于这样的杂音就会认为是无意义、不重要的,并将之忽略,我们的目的也就达到了。

这样讲可能不太直观,其实,在图像处理中,抖动也是非常实用的。

原图。

不经抖动,直接将颜色的位深处理成 1 位,导致图像只有黑白。

抖动之后,图像反而提供了更多细节。

为什么会这样?因为对于原图像,它的明亮和黑暗部分基本都是相互联系、相互贴近的,那么如果不抖动,则相近的颜色就都会都被处理成 1 或都被处理成 0,也就是连成了一片,抹除掉了相近色区域的细节。抖动则破坏了这种块面一致性,在浅色区中插入深色,在深色区中插入浅色,尽管在很小范围内带来了额外的不精确,但是一旦将观察的区域放大,反而会因为总体的相互明暗关系复原出更多细节,因为尽管有噪点,但深色区域总体仍然深,也不会像之前一样整个糊成一团了。

下面,请欣赏视频 1 bit 音乐究竟有多恐怖?声音量化精度超详细科普+对比测试

所以我们可以知道,位深度越大,量化噪声就越轻微,但人类对轻柔声音的感知能力是有限的,我们生活的环境就有环境噪音,即使是安静的家中都有 20~30 分贝左右的噪声,只不过你的大脑习惯了它,日常将之忽略掉了而已。所以,不超过这个值的量化噪声,其实根本无所谓,16 bit 的位深度本身,已经能提供足够小的量化噪声和足够大的动态范围,更别说还有抖动的帮助。

超高解析度的作用

那么超高解析度就一无是处吗?

并不是。本文探讨的是高规格对消费者是否有意义。高规格对于音频制作实际上非常有用。

超高的采样率,使音频包含超过人听力范围 1~2 个八度的音频内容,这就让对应的低通滤波器更容易构建。需要在用较低采样率重采样前先去掉高频内容,是为了避免混叠失真,原理可参见 数字音频基础 的「采样定理」一节。如果没有这么大的冗余空间,要只切掉那么一小点在技术上还挺难的,比如从 48 kHz 切到 44.1 kHz,就很困难,但如果是从 192 kHz 切到 48 kHz,就容易非常多。视频 采样率是否越高越好 展示了高采样率的实际效用。

那么更大的位深度呢?我们之前已经讨论过量化误差的问题了。在音频制作中,每一次加特技、修正等等,都意味着一次重采样,如果位深度精度不够,则每次量化误差累积起来的结果就会很可观。但如果采用 24 乃至更高的位深度,就能将累积量化误差控制在一个很小的范围,直到最后输出的时候再缩小到 16,这样既能节省空间,又能继承之前低量化噪声的好处。

所以我们可以知道,无论是高采样率还是大位深度,都是有其实际应用的,只不过这些好处对于消费者来说并没有什么意义,将这类母带级别的音频卖给消费者,并不能给消费者带来胜过 CD 规格的体验,但价钱却可以拉上去很多。

如果你仍然对自己能够分辨 Hi-Res 与高品质有损抱有信心,不妨自己做一次 盲听测试

Written by ZexWoo. All rights reserved.
主题 StackJimmy 设计 | 使用 Hugo 搭建