Featured image of post 抓轨基础与常见误区

抓轨基础与常见误区

玄学长久、持续地戕害着初探门径的发烧友,本文旨在揭露其胡说八道的本质。

抓轨基础

抓轨(Rip)

抓轨的含义是从音频 CD 中以数字形式抓取音频,亦名「数字音频抓取(DAE,即 Digital Audio Extraction)」。

CD 存储的音频规格是 16 bit/44.1 kHz,在设置抓取规格时也应按照此参数设置,而不是设置 48 kHz,由于 CD 本来就只有 44.1 kHz 的数据,采用 48 kHz 抓取不会得到任何有意义的进步,反而会因为重采样降低音质,这一点一定要注意,具体分析在后文有阐释。

AccurateRip™

AccurateRip™ 通过将抓取所得的音轨与网络数据库比对来进一步改善音频 CD 抓轨质量,确保没有任何错误发生。

AccurateRip™ 是唯一能够保证抓取所得的音轨文件 100% 准确无误的音频 CD 抓取技术。换言之,现存的 CD/DVD 光驱没有一个能够 100% 地自检错误,我们称之为音频 CD 错误检测的黑洞(即便是拥有 C2 报告能力的光驱也在洞里,无一幸免)。(欲知关于黑洞的详情,请阅读 精准抓轨指南

AccurateRip™ 是音频抓取最重要的科技,有句话说得好:「Don’t just rip Audio CDs, AccurateRip them.」

更多内容请见 AccurateRip 详解

偏移值(Offset)

偏移值是每个光驱的固有属性,存在偏移值为 0 的光驱,但是很少。如果两个不同(型号)的 CD 光驱读取同一轨,其中一者的抓取结果会稍稍偏移几个采样,因为音轨的开始点有所不同,举个例子,下图所示音轨有 24 个采样被读取(每个数字代表一个音频采样):

如你所见,每个不同的光驱读取同一音轨的方式也不同,抓轨程序能够在内部修正光驱偏移值。偏移值多以采样为单位。

Log 文件

Log 是抓轨日志文件,体现了抓轨时的软件设置、每一轨抓取是否顺利(仅在分轨抓取时产生),以及你是否抓得了一份完美的副本。它是纯文本文件,因扩展名为 .log 而得名。

若要了解关于 Log 的更多知识,请阅读 抓轨日志详解

Cue 文件

Cue 文件通常用于翻录或刻录 CD。它是纯文本文件,因扩展名为 .cue 而得名。Cue 包含有关所引用文件的信息,以及 TRACK(音轨)和 INDEX(索引)点。INDEX 点规定使用 MM:SS:FF 格式,其中 MM 是分钟数,SS 是秒数,FF 则是帧数(每秒含有 75 帧)。Cue 也能包含元数据(如 TITLE(标题)和 PERFORMER(表演者)内容)。

Cue 的流行应归功于使用 EAC 整轨抓取的用户,整轨抓取会随带 Cue。EAC 能够创建四种不同的 Cue 布局,其中三种为分轨文件设计(一个 Cue 可引用多个文件)。Cue 可用于分割从 CD 抓取的整轨文件,使之成为原始分轨,或是添加音轨(到播放列表)。

M3u/M3u8 文件

纯文本文件,用处是作为播放列表。打开它即可直接导入专辑内的所有曲目到播放软件。

常见误区

Hi-Res

Hi-Res(High-resolution audio)意为高解析度音频,属于营销术语,指的是规格高于 CD 的音乐,只要采样率和位深度中的任意一者高于 CD(当然另一属性至少要与 CD 持平)即可归类为 Hi-Res。

然而,很遗憾,与商人们宣传的内容恰恰相反,使用 Hi-Res 音乐作为听音素材是完全没有意义的、浪费存储空间的行为,为什么?我们还是从参数入手,众所周知,人类的听觉上限不会超过 20 kHz,这就意味着 44.1 kHz 的采样率已足够完美重现人类听觉范围之内的声音。那么 16 bit 提供的动态范围够吗?30~40 dB 已经算安静,如果你在室内聆听音乐,除非是降噪耳机,否则若是想听到音乐中最细微的内容,你也至少需要让它比环境噪音的音量大一点儿才行。那么,基于 30 dB 往上走 96 dB 如何?126 dB。这是什么概念?是足以导致耳聋的水平。更何况抖动过的 16 bit 音频拥有大于 96 dB 的动态范围,追求 24 bit 的 Hi-Res 根本没有必要。

下面向你展示两张普遍存在的误区示意图:

这两张图来自 索尼精选,带有一定的科普性质,向用户展示 Hi-Res 的优越性。先说说第一张图,关于动态范围的扩展,说是「可以表现出弦乐器声音的延展、消失时的细微声音」,从理论上来说,有这个可能性,但是听众能否察觉、听音设备是否有那么灵敏就是另一说了。至于「乐器、女声等高音域的表现力更加丰富」那就更加是无稽之谈了,延展出来的这部分已经属于人耳无法听到的超声波频段,难不成乐器、女歌手还能发出超声波来?女声的基准音区为 160~1200 Hz,泛音区则在 1.6~3.6 kHz 左右,44.1 kHz 的采样率已经能够准确记录 20000 Hz 范围内的声音了。

各种乐器人声频率范围表

再说说第二张图。很多人会觉得,没错儿,采样率提高、位深度增多,不就是让方格子更加细密吗?所得到的图形不就更接近原本的波形了吗?可这种理解在原理上就错了。声波的重建并非是用足够细密的小台阶去逼近波形,而是根据分立的采样点去重新生成波形,要说它像什么,它更像是一根根高低错落的棒棒糖,而最终生成的波形就和原始信号一样光滑可爱(这部分内容可以看 Digital Show & Tell 以更好地理解)。而当采样率低于信号频率的两倍时,就会在重建时产生虚假的低频信号,带来失真。

就像夜视仪,人的肉眼看不到红外线,需要依赖夜视仪将目标发射的红外线转换成人眼可见的光,试想,如果一套音频回放系统具有这样的功能,是否就等同于将超声波转换成了人耳能够听到的频率的声波?这不就是失真么?据此原理,将一个真正的 Hi-Res 降低规格到 CD 的水平,用同一套耳机抑或是音箱播放,如果它们没毛病,你不应该能听出任何区别,否则就意味着它们产生了 互调失真(intermodulation distortion)

LPCD

引用区域内文本来自百度百科词条 LPCD

艺术感觉 + 高新科技。它凭借一整套独特的技术处理,让你能在普通 CD 机上得到 LP 密纹唱片的仿真音质感受。

如果 CD 上的曲子听起来其声音和 LP 一样,无疑意味着这批 CD 的制作过程出了毛病。

现有的 CD 加工生产线制造出来的 CD 产品,在把母带加工成 CD 产品期间,数码格式需转换 5~6 次:母带-母盘 CDR-玻璃模-金属模-压碟-CD。特别是最后两道损耗性工序,对音质影响最为严重。压碟过程同时就是盘片音质不断劣化的过程。这多次的转换对音质的劣化程度,可用简单的计算机烧录试验来说明,把拷贝了 5~6 次的碟和原 CD 比较就知道了。发烧友都知道,无论是 LP 或 CD,买头版碟比较靓声,原因就在此。

这是很显而易见的谎言。按照正确的方式翻录 CD、烧录 CD,无论做多少次,数据都可保证完全没有变化。原因很简单,CD 存储的是数字信号而非模拟信号,其复制是可以做到逐位精确的,更不要说 CD 上的编码是带有纠错机制的,若是压模过程出了问题,人们也能发现。

应用雨果自行开发的音频处理系统,(A) 把原仿真母带用最高精度格式转成数码格式;(B) 把原数码母带升频至现有最高精度数码格式,并仿真化处理,之后在高精度格式化的数码系统里精细微调母带的能量密度感、动态、频宽等,最后才转成 CD 格式 16 bit / 44.1 kHz。

别看说得那么花里胡哨,这段操作说白了就是以高规格内录了一遍 LP,然后调音、做一下抖动,完了。

主要针对减低 CD 机内的数码读取系统的信号失真和纠错系统大幅度「纠错失真」。通过特殊处理的材料和加工程序减少激光光束散射,加强集中激光光束的读取能量和输出信号的精度,增强盘片转动的稳定性,减低抖晃率,减轻伺服系统的工作压力和由此形成的信号失真。

用激光读个信号也能说得那么花里胡哨在下也是深感佩服,这些事情,但凡是一张制作合格的 CD,都能做到。

黑胶 CD

百度百科 链接。

黑胶 CD 是采用独家专利的技术,加上艺术感觉的处理,即使在普通 CD 机上亦能取得黑胶唱片般的音乐享受。黑胶 CD 兼容黑胶的高保真和 CD 的低噪音,开创靓声新纪元。后期母带,德国精制。革命性的唱片制作新技术,录音现场并赋予音乐本身。

这是我见过的第二搞笑的百度词条,第一是「战术核显卡」。狗皮不通的一段忽悠。简介里说的却是:

只是盘基加了深色染料而已。这种深黑色的染色盘基依然可以让光头读写染料层上的数据,但那是光头为抵抗反射率的折损,加大输出功率的结果,让光头短命是一定的。

令人捧腹。

和这个噱头经常掺和在一起的关键词还有「试音」「车载」「发烧」等。

AQCD

引用区域内文本来自百度百科词条 AQCD

紫银合金 AQCD 是又一全新的制碟方式,AQCD(Analog Quality Compact Disc),直译就是模拟品质唱片。紫银合金,顾名思义就是该唱片使用了紫色片基、更耐热、更耐光的银合金取代传统的铝质片基,紫色可以使到激光光束更为聚集,声音便更清澈明净;以往也有采用 24K 金做唱片片基的,最新研发出来的银合金也有很高密度,而且其反射力更强,光谱改变比金更少,整体表现上比金有更为理想的效果,从而使 AQCD 的 Jitter 时基误差被减低四分之一!让唱片的声音更有模拟味道。

还紫银合金、24K 纯金……敢情 CD 就是换个材料都能弄个噱头唬人的玩意儿。这些厂家一个个都追求「模拟品质、模拟味道」,CD 显然比模拟介质要进步,这不是开倒车么?「黑胶味」「数码味」都不是什么正规的描述,也不具备可量化的标准,唯一有价值的说法是 「高保真(high fidelity)」,以保真度来衡量音频介质的优劣,从这个角度讲,CD 完胜黑胶。

CD 碟是圆形物体,最理想是做到「绝对圆心」,然而,零偏差是不可能的。一般 CD 制造标准的 ECC(偏心)是 0.07 mm,这个差距是非常少的。但由于镭射光速的直径只有 0.0001 mm,所以偏心越大,摆动也越大,虽有伺服器的帮助,但在高速转动之下,错漏也无可避免。紫银合金 AQCD 的 ECC(偏心)只有 0.04 mm,比一般认可标准提高了 42%,这个精确度可以使激光光束拾讯时更为准确,误码率大大的降低,失真率也更小了。

要是能产生足以影响读取的振动,那就是不合格品。这也能拿来吹,只能对商家的脑洞表示佩服。

小知识
  • ABX 测试:通过感官来比较两个样品之间差异,且无论是试验方法。大致流程如下:向被试展示两个样品 A 和 B,从中选择一个作为未知样品 X,然后要求被试将 X 标为 A 或 B。如果在预定数量的实验中 X 不能可靠地被标识,则不能证明 A 和 B 之间存在明显差异。
  • 双盲测试:双盲试验通常在试验对象为人类时使用,目的是避免试验的对象或参与试验的人员的主观偏向影响实验的结果,通常双盲试验得出的结果会更为严谨。 在双盲试验中,受试验的对象及研究人员并不知道哪些对象属于对照组,哪些属于实验组。只有在所有资料都收集及分析过之后,研究人员才会知道实验对象所属组别,即解盲(unblind)。如果收集资料、分析解释研究结果的统计学家同样不知道哪组资料属于对照组,哪组属于测试组,这种测试被称为三盲测试。
这两种方法被用于分析人对于不同规格音频的辨析能力,也只有双盲的听音试验才是可靠的。

真无损,还是假无损?

随着无损音乐登上历史舞台、走入千家万户,「假无损」也就不可避免地出现了。前文中说过,转码到无损格式只能保证音频数据和转码之前毫无差别,但并不能弥补有损音频已经丢掉的数据。所谓的「假无损」,指的就是原本是有损格式(如 MP3、AAC 等),却被转码成了无损格式(如 FLAC、WAV 等)的音频。既然有了西贝货,较真的人自然会寻找能够鉴定真假的方法。频谱分析法历史悠久,可靠性也相对不错,因而广为流传。

关于频谱分析法的讲解和具体操作,请参看 频谱分析指南。这里要提一些该方法的不足之处。

  1. 由于现在编码器的进步,由无损直接转码而来的有损已经完全可以以假乱真,比如 Apple AAC、LAME 编码器,只要采用高标准的 VBR 编码,其频谱完全可以骗过检测软件,即使是多次有损 → 无损 → 有损 →……→ 无损 → 有损转换,也仍旧可以通过检测,但是人用肉眼,只要有一定的经验,还是能够看出问题。
  2. 存在那么一种 CD,其母带制作之初就存在问题,导致抓轨所得的音频文件频谱非常难看,甚至比某些有损还要难看,这种情况我们称之为「有损母带」。对于此类音频,检测软件也会将其彻底判为有损,然而从过程正义性来考虑,它并不是。还有更冤枉的,一部分专辑因为录制时条件受限或是所包含的内容本身就缺乏高频(如古典音乐),导致真无损被软件「枪毙」。

在使用检测软件之前,还是应当确保自身拥有足够的判断力,毕竟软件只是死物,在很多复杂情况下的判别能力远不如人类。

那么有没有比基于频谱的分析软件更可靠的检测方式呢?对于 CD 抓轨所得的音频,确实有,检测软件名为 CUETools,使用教程请参看 CUETools 检测指南,此处便不加以赘述。

那么 WEB 源的数字音乐呢?很抱歉,CUETools 只支持 CD,你只能通过查看频谱来确认。

母带重制(Remastered)版本会更好听吗?

关于母带重制的定义,见 维基百科

关于音频真假优劣的判别,我总结了一篇教程,见 本文。我们都知道因为各人口味不同,想要客观地判断高下很难,正如有人喜欢德州烟熏安格斯厚牛堡,有人喜欢老八秘制小汉堡;一首《离人愁》,可能有的人洗脑循环,另一些人却唯恐避之不及。

事实上,歌曲的母带制作在某种程度上取决于母带制作者的主观意图,应该说,如果制作者本人对音乐有足够的理解和够深的功底,其所制作的母带应能反映其心目中认为的「这首歌应有的样子」。作为一种艺术创作,画家想要通过画作向观众表达其所见所思,音乐制作团队亦复如是。也就是说,录音室专辑制作时的考虑不会仅从听众角度出发,而是最大化体现艺术家所想要表达的意图,于是这就带来了冲突:不是所有专辑都是为了讨好听众的耳朵而制作的,所以对于同一专辑,张三更喜欢 A 版本,李四更青睐 B 版本,这是完全可能的。虽然「动态范围」是一个可供参考的指标,但如果唯动态论(动态大=牛逼),就又陷入误区了。

CD 能容纳的动态范围可以达到 96 分贝,如果歌曲本身的动态过大,加上环境噪声的响度,很可能超过安全限度,损害你的听力。由此可见,24 bit 位深提供的 144 dB 动态就更无可能被充分利用了。举个例子:Dmitri Shostakovich performed by The London Symphony Orchestra under Mstislav Rostropovich - Symphony No. 11,其第一轨,开头的内容音量非常轻,直到 11 分钟左右才达到比较常见的音量水平,如果你为了听清楚开头部分调大音量的话,后面就要小心了。于是母带工程师就需要面临一个选择:是冒着聆听者听不清轻声部分的风险保留这么大的动态,还是调整响度,方便聆听者听清整首乐曲?如果是你,你会怎么选呢?

又比如摇滚乐现场,氛围很好,大家很嗨,但是如果你是冲着听清每一种乐器的细节去,恐怕要大失所望,现场的表现肯定没有 CD 好,那么问题来了,乐器都听不清楚,要那么多乐手做什么?如果糊成一团,来什么业界大牛都没用。因此能让听众听到尽可能多的内容也是对所有参与的乐手的一种尊重。

举个例子:

这是卡拉扬一张母带重制专辑中附带的说明,写说明的是当时这张唱片的录音师。注意文本中的这些内容:

A very important contribution to this new balance has been made by the EMI engineer Wolfgang Gülich, who worked closely with Karajan over many years.

母带工程师 Wolfgang Gülich 与卡拉扬共事多年。

I’m very happy to have the opportunity, using new technology, to remaster these recordings that I made over a 20-year period. I’m sure that this is what Karajan would like and that one day he’ll give me his comments!

「我很高兴有机会使用新技术母带重制这些我二十多年前的录音。我很确定这是卡拉扬所喜爱的,且有朝一日他会发表评论。」

母带工程师字里行间洋溢着对这一版母带的满意和高兴,然而该系列在国内被很多人批评,那么问题来了,到底是录音师了解卡拉扬想表达什么,还是键盘侠们?

综上所述,不同的母带版本可能会有优劣,但同时由于它会被听者主观评价,因而也受到个人好恶的极大影响。对于理性的听音者而言,除非确实能在双盲测试中听出差别,否则对于不同的版本实在没有精挑细选的必要性。有条件的话,多收几个版本,自己做做 ABX 测试 比较比较,选择其中最合自己口味的版本,也不失为明智之选。

不同光驱抓轨的结果能相差多少?

我们必须要承认,不同光驱的读盘能力的确有差别,A 光驱无法读取的 CD 可能换了 C 光驱就能正常读取了,但是,但凡光驱能够正确读取 CD 并顺利完成抓轨,所得的音频数据应是毫无差别的。原因非常简单,CD 内存储的音频数据本质上就是一连串的 1 和 0,如果想要使之变化,势必要将一部分 1 变成 0,一部分 0 变成 1,这就与精确抓轨相悖,但凡精确抓轨,所得数据必和 CD 内存储的数据一致。

警惕虚假的高规格音频

在 Hi-fi 圈,有两首歌非常有名,一首是蔡琴的《渡口》,一首是老鹰乐队的《加州旅馆》,其各种各样的 Hi-Res 版本也广为传播,下面简要介绍 Hi-Res 潜在的陷阱。对于 Hi-Res,有两个做法值得注意,那就是填零和插值升频。比如原文件的位深度只有 16 bit,却被提到了 24 bit,这多出来的 8 bit 中没有任何有效的数据,这种情况要如何检测?

首先,打开你的命令提示符,拖入 eac3to.exe,输入一个空格,再拖入待检测的音频文件,再输入一个空格,然后输入所要输出的文件名,比如「1.pcm」,这个「1」你随便换成啥都行,怎么方便怎么来,然后回车,它就会开始工作,完成后输出日志如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
eac3to v3.34
command line: D:\eac3to334\eac3to.exe  "E:\音乐\JP\40mP\40mP - シンタイソクテイ (2013) [FLAC]\02. 少年カメラ24.flac" 10.pcm
------------------------------------------------------------------------------
FLAC, 2.0 channels, 0:04:50, 24 bits, 1799kbps, 44.1kHz
Decoding FLAC...
Swapping endian...
Creating file "10.pcm"...
Original audio track: max 24 bits, average 18 bits, most common 16 bits.
eac3to processing took 2 seconds.
Done.

简要解读一下,FLAC, 2.0 channels, 0:04:50, 24 bits, 1799kbps, 44.1kHz 一行显示了音频文件本身的相关规格,Original audio track: max 24 bits, average 18 bits, most common 16 bits. 一行表示该音频最高 24 bit,平均 18,最多 16,说明这就不是个真正的 Hi-Res,那么真正的 Hi-Res 会是怎样的结果?

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
eac3to v3.34
command line: D:\eac3to334\eac3to.exe  "L:\Hi-Res\[180328]TVアニメ「宇宙よりも遠い場所」オリジナルサウンドトラック[48 24]\13-まあなんとかなるんじゃない_.flac" 1.pcm
------------------------------------------------------------------------------
FLAC, 2.0 channels, 0:01:49, 24 bits, 2422kbps, 48kHz
Decoding FLAC...
Swapping endian...
Creating file "1.pcm"...
The original audio track has a constant bit depth of 24 bits.
eac3to processing took 1 second.
Done.

The original audio track has a constant bit depth of 24 bits. 恒定的 24 bit 位深。

在检查完毕后,记得删除生成的 PCM 文件。

以上就是关于 Hi-Res 文件位深的检查方法,高位深对于减少累积量化噪声是有帮助的,通俗点说,使用 Hi-Res 作为音频编辑、加特技的素材时,其在多次、反复调整、编辑之后累积下来的量化噪声会更小,这也是为什么在母带制作时应当使用 24 bit 的原因。但对于一个已经制作完成、只等用户去聆听的音频文件而言,16 和 24 bit 并无任何可察觉的差别。

那么什么是插值升频呢?它属于 采样率转换(SRC,即 sample-rate conversion)的一种类型,举个例子,笔者以 16 bit / 44.1 kHz 的规格生成了一段 20~20000 Hz 的频率扫描音频,频谱图如下:

以 48 kHz 的采样率对其重采样,会得到什么结果呢?

你可能需要放大图片才能看到比较暗淡的线浮在主要频率的上方,它们就是因为重采样而产生的虚假信号(因为原来并没有这些东西)。为什么要升频?简单来讲,升频并没有增加丝毫有效信息,反而存在着引入失真的风险,唯一的作用大概就是看起来更唬人了吧!

拓展阅读

国际声学与心理声学行业专家图尔(Floyd E.Toole)著有一本《声音的重现:理想听音环境构建指南》,非常有助于发烧友提升理论知识和指导实践。

链接:百度网盘(提取码:ewb0)。

Written by ZexWoo. All rights reserved.
主题 StackJimmy 设计 | 使用 Hugo 搭建