Gary课堂 | 动听音乐从哪来?从CD到声波(DSD与PCM篇)
【DSD与PCM篇】
上期我们讲到了CD当中音频是怎么存在的,并且简单讲了一下DAC的工作(戳我回顾),这一期我们来看看DSD音频与传统的PCM音频又有什么区别~
当一个DAC收到来自播放器传递过来的数字音频信息时,它需要做的就是解码。其实整个解码的过程是需要先把音频文件从这44.1kHz的采样信号提取出20kHz以内的有用的音频信号,其中涉及到的数字滤波以及Dither技术我们下节再详细讲解。数字模拟转换的过程就是将1010101这样的数字信号变成对应的电压信号,那么其中的1就是接通开关,0就是断开开关,“1010101”就是一个7bit的信息(有7位二进制数字)。而通常音频DAC每秒要接收44100个16bit的音频信息。
这是一个基本的3bit R-2R类型的DAC,假设其电压源为10V直流电,当只有开关B0导通时,可以计算其戴维南等效电压电阻:Rth = 100+110//100k = 152.381k, Vth = 1.25v, 后面的TL081实质上是一个电压跟随器做缓冲。当只有开关B2导通时,Rth = 100k//100k = 50K,Vth= 5v。或者可以像图片当中的绿字一样计算,B2负责1/2精度,B1负责1/4精度,B0负责1/8精度。所以B2位为MSB(最高位)B0为LSB(最低位),通过这样的不同的电阻之间的搭配组合可以输出不同幅度的电压,所以只需要通过控制电路控制这三个开关之间的组合就可以输出不同类型的电压,如果把图片中的10V直流电替换成一个标准音频定义的2Vrms电压区间,那么这个3bit R-2R DAC最精细可以输出5.6Vpp/(2^3)= 0.7v,显然与上文中描述的16bit要求的0.00008545v相差甚远。
虽然精度不够,但该类型的DAC对于任何bit的数据都可以解码,当一个超过3bit的信号输入进来时只需要丢掉LSB就可以保证输出信号大致没问题,只不过精度会差得多。这种R-2R类型的DAC固然好,但是如果想设计一个16bit甚至20bit以上的DAC就必须精准的控制其中的电阻,成本必然会非常高。据说Analog Devices具有先封装后采用激光调整电阻值的工艺可以提供非常精准的DAC器件。而且这种类型的DAC开关之间会产生一些glitch也就是毛刺,因为R2R表达的是采样点之间的直流电,如何消除这类glitch使得信号连续化也是一门学问。由于参考源是直流电源,所以这类DAC对于供电也有比较严格的要求。当然还有一种不惜成本的提升精度的方法就是一个DAC芯片只负责一半的音频电压信息,另一个DAC芯片负责另一半的音频电压信息,或甚至你可以并联更多的DAC,但电路是庞大的,成本是不计其数的。在这条路上走极致的公司有MSB Technology、TotalDAC、Rockna Audio、SchiitAudio。
另一种解码思路则是采用先微分再积分的手段,被称之为Delta-Sigma架构,这类DAC普遍使用在当下的便携设备中,由于它是一种另类思路,所以他基本上不需要如此复杂的解码步骤,不需要这么多开关,这么多电阻,成本非常的低,并且这类DAC的总谐波失真参数非常好,但精度通常不高(一般只有5~6bit左右)。
了解Delta-Sigma DAC之前我们可能需要了解一下什么是PDM、PWM调制。
如图为一个基本的PWM调制过程,原始信号为红色的B,调制后的蓝色信号为PWM信号,PWM信号是如何记录原始信号的呢?
打个比方,测量一排人的身高,0m,1.8m,1.8m,1.5m,1.6m,0m这就是传统的音频文件或叫做PCM的记录方式,而PWM则是0m,+1.8m,0m,-0.3m,+0.1m,-1.6m。没错,PWM只记录了他们的变化量,而这个变化量记录在时间坐标上占用的空间大小被称之为“占空比”。把这样一个原始信号混入特定频率的三角波(取决于计算性能)通过“比较器”就可以输出PWM波形。这个记录过程被称之为“求微分”的过程,如果反过来把PWM信号变为正常信号则是一个“求积分”的过程。而这个“求微分”的过程本身就是一种数学运算,可以通过计算机的数字电路完成,不需要特别多的开关、电阻等模拟器件。
把这样一个PWM信号只需要通过一个脉冲开关发送出去,解码出音频信号只需要在后面加入一个LPF低通滤波器即可解码出音频信号,其实本质上也是一个积分器。
既然Delta-Sigma如此方便省钱,为何不推出一种格式,其本身就是PWM,连电脑计算都不需要做了,聪明的你肯定想到了索尼大法力推的DSD(Direct Stream Digital)格式。 DSD格式本质上就是一种PDM调制,和PWM的区别在于纵坐标没有零刻度轴,只有一排方波。
索尼的DSD64格式号称64倍于CD信息我个人认为有点夸大其词,但确实不可否认的是,DSD这种格式的横坐标上每秒确实存在2822400个棒棒糖,如果CD格式的横坐标上每秒只有44100个棒棒糖的话,时域上这么密集数量的信息量,无论是真实的信息也好,电脑计算出来的信息也好,他们都实实在在的对于谐波信号有完美的抑制作用。你可以想想一下,当你看一个320FPS的视频一定要比一个5FPS的视频顺畅,哪怕是插值的,或者图像本身并不清晰,但他也是顺畅的。所以DSD天生拥有极其干净的音频。所以当你测量一个Delta-Sigma DAC或者DSD音频的THD(总谐波失真)时,恐怕参数是极其恐怖的(千万不要测CHORD Electronics家机器的THD参数)。
但是话说回来,这种音频格式真的足够优秀,取代传统PCM格式么?不见得。
如果你按照“积分”的方式换算一下DSD64拥有多少bit信息你就会发现其中的问题。传统CD格式的纵坐标有2^16 = 65536层振幅信息,如果以1/44100秒为单位,1秒为单位,CD格式永远只有65536层振幅信息。反观DSD64,如果以1/44100秒为单位,2822400/44100= 64倍,DSD64只有6bit精度,也就是2^6= 64,如果以1秒为单位,DSD64则拥有接近21bit的精度,所以你发现其实DSD的精度是很难量化的,它与时间单位密切相关。但通常意义上,音频格式以1/44100秒为基准,DSD64则实际有6bit的精度。
或许有人会说,提高PWM的频率不就可以了嘛?DSD64的频率是2.8Mhz,可以实现6bit,DSD128的频率是5.6Mhz,可以实现7bit,DSD256的频率是11.2Mhz,可以实现8bit,以此类推,实现16bit需要达到2.87Ghz,显然无论对于计算器件以及开关器件的要求也是相当苛刻的。当然你也可以像并联R-2R DAC那样分散计算力,但总计算量是不变的。感兴趣的朋友可以先看一下一个DSD64歌曲占用多少磁盘空间。并且,因为PDM调制“占空比”是以时间为精度单位的原因,所以Delta-Sigma系统对于时钟要求极其苛刻,需要在系统的任何环节尽可能保证信号传输的稳定性。一般来说因为Delta-Sigma调制过程发生在DAC内不会有太多Jitter,但在DAC接收信号的过程中需要尽可能保证稳定接收,如果是PC-HIFI玩家,适当提升CPU缓存(总线)频率、内存频率、System Agent频率、提升CPU电压与PLL电压、关闭CPUHardware Prefetcher等措施都可以适当减少数据Jitter。
其中提升PLL(锁相环)电压对于抑制Jitter的效果最为明显,高档的Hi-Fi设备中也有PLL(Phase-lockedloop)用于抑制Jitter。高速的锁相环先是将输入的信号时钟通过一个鉴相器(对比本地高精度时钟与输入时钟的差异,并且输出这种差异),然后通过一个低通滤波器将这种差异转化为电压差(就像Delta-Sigma解码过程),通过电压的差异控制并调节本地高精度时钟的快慢速度,本地时钟VCO即是一个压控振荡器,最后同时再将本地时钟VCO的信号反馈给输入的鉴相器,形成一个反馈环路。这样就可以使得输入的信号与DAC解码信号的速度同步起来。
在Delta-Sigma DAC这条路上走极致的典型公司有CHORD Electronics、dCS ring DAC、Esoteric。
DSD格式的第二个缺点,它永远无法被编辑!!!因为,好吧,显而易见你是不可能编辑一连串方波的……当然有些软件可以把它们转化为24bit 192khz等超级音频格式后编辑,从而尽可能保证DSD音频在编辑时没什么损失(但显然还是有损失的)。当然,Delta-Sigma还是可以靠一手“噪声整形”带来不错的聆听体验
说到现有的音频测量体系,其实嘛,并不完善。但至少那些容易测量的参数还是能起到很大辅助作用的。Audio Precision AP2700系列音频测试仪是目前业界功能比较强大的音频测试仪,对于普通音频设计师来说已经足够用了。如果你想测量一个DAC的精度?好吧,现有的测量仪还不能快速的进行测量,通常精度有关的DAC参数为INL、DNL,感兴趣的朋友们可以看一下如下链接:https://www.maximintegrated.com/en/app-notes/index.mvp/id/283
至于每个人的听感,其实也是不一样的,就像前一段时间很流行的Yanny or Laurel的测试,或就像风靡一时的白金、蓝黑裙子的测试,有的人对于音乐内容的丰富程度以及乐感很敏感,那么推荐你使用R-2R的解码器,假如你对于声音的干净度流畅度、声场,舞台感非常重视,那么推荐您使用Delta-Sigma类型的解码器。而笔者本人是属于对于声音的乐感非常重视的一群人,通常这类用户都有比较敏感的性格,而敏感人群通常在自然界的占比是比较少的。
这一期当中我们简单介绍了一下DSD格式和传统PCM格式的区别,也简单介绍了一下R-2R解码器和Delta-Sigma解码器的工作原理。后文当中,我们还会进一步对变成声音的过程进行讨论,感兴趣的朋友不妨收藏、点赞、转发一下、让更多感兴趣的朋友关注极客湾,如果有机会的话,我会请专业的录音师朋友帮大家解读《从麦克风到CD》,包含一些专业的录音学问,从麦克风的选择、保养、场景布置、常用的录音手段、录音仪器、以及录音师与发烧友在“音质”方面不同的理解。谢谢大家!
▼
戳图片传送至往期精彩

喜欢我们的推送别忘了点一个顶
向亲朋好友推荐一下我们的文章
或者赞赏一下
我们下期再见啦!
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- 1 跟着总书记探寻文明之光 7904180
- 2 中方回应朝鲜确认向俄罗斯派兵 7808579
- 3 新娘因长相太美被质疑AI换脸 7712002
- 4 关税冲击如何应对 7619036
- 5 今年首个“蛇年蛇月蛇日蛇时”来了 7520812
- 6 曹骏 内娱寻亲第一人 7426535
- 7 外交部回应李嘉诚卖港口:望审慎行事 7331445
- 8 太原现“晋A好几个8”车牌 交警调查 7236406
- 9 郭晶晶夫妇现身李兆基丧礼 7141185
- 10 夫妻俩因为孩子丢失 35年几乎不说话 7045359