什么是音频数字水印
数字水印是在不影响宿主媒体主观质量的情况下,在宿主媒体中嵌入不易被人察觉的标识信息。而音频数字水印则是基于音频数字内容生成或者嵌入的一段标识,该标识可用于标识数字音频内容的版权归属,也可用于保护音频数字内容的完整性。当音频水印用于标识音频数字内容的版权归属时,在音频数字内容生成、管理、分发以及使用的整个生命周期中,音频水印被以无法感知、无法剥离的方式加入进音频数字内容中,一旦发生版权纠纷,将音频数字内容中所嵌入的水印信息提取出来即可证明其版权归属方。1
音频数字水印对我们的影响
从隐私角度来看,版权方完全可以根据购买者的私人信息生成一段特有的水印加入音频,从而追溯侵权行为。但是这样已经涉及到对个人隐私的侵犯,所以目前都是通用的水印,但谁也不知道将来会怎样。
从音频听感角度来看,糟糕的算法会对音频内容造成不可逆的可感知破坏,这也是有人察觉并在网上披露出来的原因。下面展示一段音频数字水印的频谱:
水印的能量集中在 1~2.3 kHz 和 2.3~3.6 kHz 的频段,这是人耳相当敏感的频段。
如果你想要感受水印会带来什么影响,可以 点击这里 试听一些。
多数普通听众可能注意不到音乐中的水印,因为其可听性与音频内容密切相关。古典乐,尤其是钢琴独奏受到的影响最大。我在古典音乐论坛上看到过抱怨,其中的描述说明了水印的特征性颤动。这些听众可能敏锐地意识到了这些声音质量问题,但只是将其归咎于有损压缩或流媒体服务。
做点实验吧
距离文章写成时间较近且著名的例子是 Taylor Swift - Folklore
。有诸多流媒体服务商提供这张专辑的 Hi-res 下载,包括:网易云、Qobuz、Tidal、Mora、HIGHRESAUDIO。据可信消息,来自 Qobuz 的音频有水印而 HIGHRESAUDIO 没有。下面,分析未和谐(Explicit)的第 14 曲《Betty》。
首先是观察频谱并记录音频 MD5。它们的长度完全一致,都是 4:54.521
(12988379 采样)。
从视觉上来看,除了 Tidal,剩下四张图看起来没什么差别,而 Mora 与 HIGHRESAUDIO 逐位精确、丝毫不差。Tidal 与其他来源完全不同的原因在于,它是 MQA 编码,令人作呕。
下面要做的事情很简单,HIGHRESAUDIO 源没有水印,那么,从有水印的源减去 HIGHRESAUDIO,得到的,不就是水印了吗?只需对 HIGHRESAUDIO 源做反相处理(使波形上下颠倒),再将两个源合并,即可得到相消的结果。下面展示结果频谱。
- 第一张图可以明显看出网易云在 1~2.5 kHz 的区间「加了点料」,怪有意思的。此外,网易云还有一个骚操作,那就是拉响度,音轨峰值直接干到了 1,特别「棒」。
- 第二张图中,Qobuz 在响度上总体更小,而且其水印的添加与音频内容更有相关性。其音轨峰值为 0.922627,而 HIGHRESAUDIO 的音轨峰值为 0.944118。
- 第三张图……就不说了吧。
- 第四张图,其实不用实际操作我也知道结果,自己减自己当然什么都不会剩下,但考虑到实验的严谨性,这一步还是做给大家看。
- 第五张图,就有意思了,既然俩都有水印,那来个「以毒攻毒」,岂不美哉?于是我们看到,有两个频段的颜色较为明显,中间还有一条分界,看来两家的水印出现的频段不同。
那么,以上就是实验的全部内容了。如果你想知道水印听起来是什么感觉,点此下载 即可。提取码:tueo
。
-
于腊梅. 基于版权保护的音频数字水印概述[J]. 电声技术, 2019, 43 (02): 15-17. ↩︎