揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM
轉(zhuǎn)自:http://www.techbang.com/posts/22079-unlocking-the-mystery-of-dsd-the-dsd-digital-audio-coding-vs-pcm?page=1
引言
先前我們介紹了不同數(shù)位音訊的儲存格式,裡面有些微提到一些脈衝編碼調(diào)變(Pulse-code modulation,PCM)的基礎(chǔ)概念,但除了PCM或更精準地說是線性脈衝編碼調(diào)變(Linear pulse-code modulation,LPCM)之外,近期還有一個非常受關(guān)注的DSD(Direct Stream Digital)編碼格式。現(xiàn)在市面上的高階播放器,大多打著能支援DSD解碼來當作一個賣點,但是到底甚麼是DSD編碼格式?是否真的有如同廠商宣稱提供更優(yōu)良的音質(zhì)?這就是本篇文章所要和大家一起探討的,底下就讓筆者來簡單的介紹一下DSD歷史。
Direct Stream Digital的歷史
事實上DSD的起源已經(jīng)非常久,早在60年代就已經(jīng)有利用脈衝密度調(diào)變〈Pulse-density modulation,PDM〉編碼,將音頻訊號記錄在數(shù)位媒體上,正確來說應(yīng)該是由PDM一個特殊分支 -脈衝寬度調(diào)變(Pulse Width Modulation,PWM)來實現(xiàn),這種編碼方式目前已經(jīng)完全被PDM格式所取代。
目前常見的DSD編碼就是基於PDM規(guī)範,這個音樂編碼格式的標準規(guī)範在1999年發(fā)表,是由當時領(lǐng)導(dǎo)音樂儲存格式的巨頭Sony和Philips合作開發(fā),至於為何制定DSD規(guī)範的原因有些複雜。主要是因為那時候由Sony和Philips所制定的CD 〈Compact Disc〉規(guī)範專利快要過期,在即將失去由CD專利帶來的大量收益情況下,Sony和Philips決定再次聯(lián)手打造下一代的音樂儲存規(guī)格Super Audio Compact Disc 〈SACD〉,所以DSD的出現(xiàn)絕大部分是因為商業(yè)考量。
在儲存編碼上,SACD使用和CD常見PCM編碼完全不同的音訊格式,採用單位元的DSD編碼。Sony花下重金聘請當時最頂尖的兩位聲音工程師Ed Meitner〈現(xiàn)任職於EMM Labs〉和Andreas Koch 〈現(xiàn)任職於Playback Design〉來制定SACD規(guī)範,並且在初期免費開放給大多數(shù)知名錄音室使用,這成為DSD音訊儲存格式第一次大規(guī)模被使用在商業(yè)活動上。
超級音頻光碟〈SACD〉的起源
講到DSD自然必須介紹一下SACD,SACD取樣頻率高達2822.4kHz,是一般CD取樣頻率44.1kHz的64倍,而且理論上具有能夠再生100kHz以上頻率範圍的能力。此外由於SACD使用DSD的脈衝編碼,因此省去位元轉(zhuǎn)換的過程,同時降低數(shù)位濾波可能產(chǎn)生失真和雜訊的問題。
雖然這一切都讓SACD聽起來非常的美好,但SACD在推廣的路途上卻是相當艱難,因為當Sony和Philips決定用專利屏障再次壟斷音訊儲存格式時,其他音樂製作公司和硬體生產(chǎn)商卻看上了正蓬勃發(fā)展的DVD光碟,並且希望利用這個容量更大的儲存媒介來發(fā)行高品質(zhì)音樂光碟,就此開啟了新世代音樂儲存媒介規(guī)格的戰(zhàn)火。
Super Audio CD和傳統(tǒng)CD音樂光碟規(guī)格比較
高品質(zhì)音樂儲存規(guī)格之爭
DVD-Audio規(guī)格很迅速地在SACD出現(xiàn)的隔一年後正式上路,使用和CD相同的LPCM編碼,並且可以儲存高達192kHz/24bit雙聲道的高品質(zhì)音樂。DVD-Audio在音樂製作上和傳統(tǒng)的CD音樂並沒有太大區(qū)別,由於多數(shù)音樂製作公司都歷經(jīng)過CD格式的洗禮,因此剛開始大部分音樂製作公司,偏向選擇技術(shù)上更加成熟的DVD-Audio規(guī)格,當然也有一部分理由是可以擺脫Sony和Philips的專利束縛。
想當然,Sony和Philips為了捍衛(wèi)自家格式和利益自然會做出反擊,Sony和Philips藉由自己在硬體製造上的優(yōu)勢,拉攏大多數(shù)DVD播放器製造商,讓後續(xù)生產(chǎn)的DVD播放器無法相容DVD-Audio。這個作法嚴重的打擊DVD-Audio陣營,雖然DVD-Audio陣營有不少大型公司支持,但是其內(nèi)部意見卻是相當分歧。由於每個成員都怕被另一個規(guī)範所束縛,這為DVD-Audio推廣之路種下了失敗的種子。
另外更令內(nèi)部成員驚恐的是,在那音樂盜版猖獗的年代,DVD加密法很快地就被駭客所破解,每個音樂製作公司都害怕DVD-Audio會重演CD的盜版局面,因而都裹足不前。第一份正式DVD-Audio音樂光碟,居然是由一個發(fā)燒友,在缺乏良好錄音設(shè)備的小型研究室錄製。
在DVD-Audio陣營內(nèi)部互相猜忌的情況下,Sony乘勝追擊的許諾SACD將永遠不能被電腦所播放,這幾個舉動成功穩(wěn)固住SACD作為新一代音樂光碟的地位,並且也解決了雙方陣營長久以來懼怕盜版的疑慮。
▲SACD標誌及SACD的種類。由左至右分別為 〈1〉單層SACD〈4.7 GB〉 〈2〉雙層SACD〈8.5 GB〉 〈3〉混和型SACD〈4.7 GB〉 〈圖片來源:網(wǎng)路資源〉。
SACD的殞落
經(jīng)過上面一大串折騰和較勁之後,Sony和Philips陣營開始自信滿滿地宣傳和推廣多聲道格式SACD,並且宣稱未來是高品質(zhì)多聲道音樂的年代,而且也漸漸獲得多數(shù)音樂製作公司的認同。眼看著儲存格式大戰(zhàn)就要分出勝負的時候,Apple的iPod迅雷不及掩耳上市了,爾後幾年將線上數(shù)位音樂下載量,更提升到了一個驚人的程度。
面對Apple所掀起的線上數(shù)位音樂潮流,Sony選擇繼續(xù)維持SACD的生產(chǎn)和發(fā)行,並且在2003年規(guī)劃出同時擁有傳統(tǒng)CD層和SACD層的混和型SACD,期望在實體音樂光碟銷售上有所突破。但是這很快地就碰上SACD播放器銷售不佳的問題,因為當年的SACD播放器價格大多落在5,000元美金以上〈約新臺幣15萬〉,非常少消費者願意購買昂貴,而且只能播放音樂的SACD播放器,因此讓SACD的銷售受到直接的影響。
再加上幾年後,Wavelength Audio發(fā)布了基於電腦播放的非同步USB DAC,這使得利用電腦播放高品質(zhì)音訊檔案變得更加容易。爾後又隨著全世界網(wǎng)路速度的提升,和線上音樂的流行,出門購買音樂光碟漸漸的不再是獲得高品質(zhì)音樂唯一來源,SACD就此成為只有少部分音樂愛好者的選擇。
▲混和型SACD結(jié)構(gòu)圖和讀取機制,混和型SACD具有一層4.7GB容量的DSD層〈上層〉,同時還包含一個符合PCM紅皮書的CD音樂層〈下層〉,這使得它能夠相容於傳統(tǒng)的CD播放器。〈圖片來源:Wikipedia〉
2006年,在體認到SACD幾乎已經(jīng)不可能成功的情況下,Sony做了一個策略上的大轉(zhuǎn)變,推翻之前SACD將不會被電腦播放的承諾。Sony推出以SACD為基礎(chǔ)的DSD-Disc,這個格式的SACD將舊有物理防拷貝保護層移除,使得電腦也能夠讀取這類型光碟片。
但是由於已經(jīng)失去市佔率,DSD-Disc在完全沒有推出過任何商業(yè)音樂光碟下就被拋棄,從2009年後就已經(jīng)沒有大型商業(yè)音樂製作商,使用SACD當做音樂儲存媒介。雖然到這邊,由Sony和Philips主導(dǎo)的SACD已經(jīng)完全潰敗,但也為後續(xù)的DSD格式音樂打開了另一扇大門。
DSD音樂播放原理
上面看完了DSD音樂格式的歷史資訊,這邊筆者想先來介紹一下DSD到底和PCM有甚麼不同,首先我們就從介紹DSD音訊編碼開始。DSD編碼DSD則使用不同於以往PCM邏輯來記錄音訊,DSD訊號是以ΔΣ調(diào)變後的PDM編碼形式儲存在儲存媒介上,DSD的內(nèi)部記錄的是一個連續(xù)時間的單一位元序列,以固定的時間間隔來記錄,在標準的SACD規(guī)格下每個取樣間隔是1/2822400秒,取樣頻率為CD規(guī)格 〈44.1kHz〉 的64倍之高。
DSD每一次取樣會比對本次取樣和上一個樣本值的變動,接下來使用0和1來記錄振幅的變化,0代表比上一個訊號值來得低,1代表比上一個訊號值來格高,所以每一個取樣的訊號是和前一個訊號的相對值。DSD藉由非常高的取樣頻率,將以往量化不精準所造成的失真,下降到一個位元以內(nèi)的誤差。
▲DSD音訊PDM編碼示意圖,DSD在每1/2822400秒記錄下一個單位元的資料,每一次記錄的資料是和前一個資料的相對值。〈圖片來源:Wikipedia〉
為了確保每一位讀者,都能夠輕易理解等一下的DSD和PCM比較,在這邊快速地介紹一下PCM編碼。PCM編碼主要包含取樣〈Sampling〉、量化〈Quantization〉、編碼〈Coding〉三個過程,如下圖上半部所示,PCM也是在一個固定的間隔時間內(nèi)〈如CD是1/44100秒〉記錄下原始類比訊號的振幅。
但和DSD不同的是,PCM記錄的是一個絕對值而非DSD的相對值,每一個不同的振幅強弱都有其代表的數(shù)值。然後再將記錄下來的數(shù)值轉(zhuǎn)換成離散時間訊號,最後再依據(jù)PCM規(guī)範給予一個編碼就是常見的LPCM格式數(shù)位音訊。簡單來說,PCM編碼就是在連續(xù)的時間〈X軸〉座標下,記錄當時的振幅〈Y軸〉大小。
▲Linear-PCM編碼示意圖,在固定時間間隔下〈圖中為1/44100秒〉,記錄當下的振幅大小的絕對值。〈圖片來源:Wikipedia〉
DSD音樂播放
DSD音樂的記錄和播放流程,相較於傳統(tǒng)PCM編碼來得簡化許多,由於目前市面上主流是使用基於單位元的類比數(shù)位轉(zhuǎn)換器(analog-to-digital converter,ADC),來進行音樂錄製。所以如果將錄下來的聲音直接使用DSD格式儲存的話,在播放時只需要在輸出端,經(jīng)過一個開關(guān)電容網(wǎng)路構(gòu)成的低通濾波器,來還原成類比訊號即可。
整個流程相較於傳統(tǒng)的PCM處理,省去了在錄音端單位元轉(zhuǎn)多位元的過程,和在播放端必須經(jīng)由超取樣和ΔΣ調(diào)變成PDM訊號的手續(xù)。這使得DSD具有非常好的先天優(yōu)勢,並且理論上能夠在硬體端節(jié)省下多餘的處理元件,也間接地降低處理過程所產(chǎn)生的失真。
SACD較早時期採用1bit轉(zhuǎn)換技術(shù)造成的高頻抖動〈dithering〉與諧波〈Idle Tone〉等問題,目前的DAC晶片為了因應(yīng)1bit解碼缺點,大多使用多位元〈例如:6 bit,64階〉的ΔΣ調(diào)變。此種調(diào)變混合1bit PDM和PCM的優(yōu)點,在低電位輸出時直接調(diào)整輸出脈衝電壓為低電壓,可以讓後續(xù)的低通濾波電路設(shè)計問題簡化不少。在理論上看起來是如此的完美,但是人算不如天算,完美的事情永遠只在理想狀態(tài)下發(fā)生,筆者將在後面的章節(jié)和各位討論DSD所需要面對的問題和優(yōu)勢。
▲〈上圖〉PCM音訊的錄製和播放流程簡圖,總共歷經(jīng)兩次超取樣處裡和兩次位元數(shù)轉(zhuǎn)換,〈下圖〉理想狀態(tài)下DSD音樂錄製和播放流程簡圖,過程中無須經(jīng)過超取樣和位元數(shù)轉(zhuǎn)換。
DSD和PCM編碼比較
由上面的介紹就可以看出,DSD和PCM是兩種完全不同思維模式的編碼,而兩種規(guī)格也擁有各自的優(yōu)點和缺點,底下筆者將非常淺顯的介紹DSD編碼相對於PCM編碼的優(yōu)缺點。
DSD編碼優(yōu)勢
理論上極高的取樣頻寬:
標準的DSD音樂使用2.8224MHz取樣頻率,理論上能夠記錄最高到1411.2kHz〈取樣頻率的一半〉的聲音,相較於傳統(tǒng)CD使用的44.1kHz取樣頻率,這讓DSD格式擁有非常寬廣的取樣頻寬,即便和目前錄音室常見的高規(guī)格24bit/192kHz PCM錄音相比〈取樣頻寬最高達96kHz〉,DSD也擁有超過14倍之多的取樣頻寬。
優(yōu)良的動態(tài)範圍〈0~20kHz〉:
DSD訊號經(jīng)由高頻雜訊整形〈noise shaping〉電路處理,將DSD帶有的高頻雜訊,提升到超越人耳聆聽範圍外的頻率後,在0~20kHz的頻率範圍內(nèi),DSD擁有理論數(shù)據(jù)上高達150db的動態(tài)範圍 〈如下圖〉,相較於16 bits/24 bits PCM編碼的96db/144db動態(tài)範圍,DSD編碼理論上擁有更好的動態(tài)範圍〈0~20kHz〉。
▲DSD和PCM編碼比較,紅色框格內(nèi)代表24/96kHz PCM編碼可記錄的範圍,橘色為24/192kHz,綠色為24/384kHz可記錄範圍,24bit的PCM訊號底噪坐落在記錄範圍之外,理論上小於-144db;藍色線為2.8224MHz DSD在不同頻率範圍的底噪示意圖,可以發(fā)現(xiàn)在大約30kHz後,DSD編碼的底噪急遽上升,在接近極限頻率時達到大約-6db的響度。〈圖片來源:Playback Designs〉
更小的音樂容量:
DSD編碼在儲存容量上也具有一定的優(yōu)勢,隨著音質(zhì)的提高,PCM音樂的檔案大小可以說是指數(shù)型成長。而DSD由於編碼上的優(yōu)勢,在標準的2.8224MHz取樣頻率下,DSD的檔案容量只約略超過24/96kHz的PCM音樂一些。這使得DSD不論是在儲存或是網(wǎng)路下載,都比PCM格式來得有優(yōu)勢。
除了上列的優(yōu)勢之外,DSD音樂在播放時還具有無取樣頻率限制、直接支援DAC主要時鐘和長傳輸距離的優(yōu)點。
DSD編碼缺點
上面提完DSD的主要優(yōu)勢,但就跟多數(shù)的規(guī)範一樣,DSD也有其無法克服的技術(shù)缺點。而且這些實際操作上的缺點,反倒嚴重的抵銷DSD上述的優(yōu)勢,並且在大多數(shù)情況下還產(chǎn)生更多的問題,底下就讓筆者來介紹一下DSD編碼相較於PCM編碼有甚麼樣的缺點。
實際上較窄的頻率範圍:
標準的DSD編碼有一個先天的缺點,相較於CD規(guī)格的16bit/44.1kHz的-96db〈16*6db〉底噪來說,DSD的底噪高達-6db,這個現(xiàn)象在實際測量上也可以觀察到〈見圖X〉。DSD編碼在超過20kHz的時候,會產(chǎn)非常大量的高頻雜訊,如果不將這些雜訊移除,將會對後端的音響器材造成傷害。所以必定需要經(jīng)過濾波技術(shù)的處理,現(xiàn)在的處理方式是利用雜訊整形電路,將雜訊移到人耳聆聽範圍外〈>20kHz〉。
但這也說明後續(xù)就要由低通濾波器將這些雜訊移除,由Sony的規(guī)範書來看,DSD訊號必須經(jīng)由一個截斷點為50kHz的低通濾波電路處理移除高頻雜訊。這使得現(xiàn)實上在播放時能使用的最大頻率範圍,大約只比30kHz高一點點,這直接影響到DSD其中一個優(yōu)勢:「理論上極高的取樣頻寬」。為了減少高頻雜訊的問題,目前最新的DSD檔案都使用雙倍的取樣頻率〈DSD128〉,理論上藉由雜訊整形電路,能夠?qū)⒏哳l雜訊推到更高的頻率範圍,但實際上還是無法解決通過低通電路後實際能用的頻率範圍。
檔案經(jīng)過多次格式轉(zhuǎn)換:
由於DSD編碼是一種單位元的記錄格式,使得DSD音訊幾乎完全無法利用現(xiàn)在的音訊設(shè)備來編輯,因此在音樂後製的時候,DSD音訊還是必須被轉(zhuǎn)換成PCM音訊來編輯。目前的DSD音樂編輯模式,是先將DSD轉(zhuǎn)換成Digital eXtreme Definition〈DXD〉格式,DXD本質(zhì)上就是352.8kHz / 24bit的PCM編碼音訊,等後製和音樂編輯完畢後,再轉(zhuǎn)換為DSD訊號。因此DSD音樂檔案反倒同時繼承DSD和PCM的缺點,並且在多次的轉(zhuǎn)換過程中,還會額外導(dǎo)入另一層的高頻雜訊,這使得DSD原本希望移除PCM編碼缺陷的初衷,完全不存在現(xiàn)在的DSD音樂中。
相對高解析PCM編碼沒有顯著優(yōu)勢:
DSD編碼當初的比較目標大多是CD規(guī)格的PCM音訊,但在高解析度的PCM音訊流行的當下,高解析度PCM音訊實際可用的取樣範圍和雜訊控制能力,完全優(yōu)於標準的DSD格式〈見圖X〉。為了解決這個問題,剛剛提到雙倍取樣的DSD128音訊就此誕生,雖然可以些微的降低DSD雜訊過高的問題,但單位元編碼先天上的缺陷依然存在,並且雙倍取樣的DSD128音樂檔案大小,對比高解析PCM音訊來說,也變得沒有儲存容量上的優(yōu)勢。
硬體支援度不廣泛:
DSD處理對於目前已經(jīng)習慣PCM音樂已久的音樂製作公司來說,必須投入額外的成本才能進行後製,所以嚴重的影響到DSD格式的推廣。此外目前市面上絕大多數(shù)支援DSD播放的DAC,是將DSD音訊重新編碼回PCM訊號的方式來播放,只有非常少部分的DAC支援原生播放DSD音樂。除此之外,DSD傳輸並沒有被大多數(shù)傳輸規(guī)範所納入,像是USB Audio 2.0和Mac平臺的特性規(guī)範中,音訊傳輸就只有標準PCM一種格式。
好在最近被推廣DSD-over-PCM〈DoP〉傳輸規(guī)範解決這部分的問題,這個傳輸規(guī)範使用24bit/ 176.4kHz PCM傳輸來包裝DSD訊號,利用前面8個位元來當做DSD的標記。又由於2.8224MHz取樣的DSD音訊資料量相當於16bit/176.4kHz的PCM音訊資料量,所以後面的16位元就可以用來包裝DSD音訊,讓有能力的硬體廠商自行研發(fā)DSD解決方案,並且也讓不支援DSD傳輸?shù)膇OS系統(tǒng)有機會播放DSD音樂。當然這樣的傳輸規(guī)範也有它的缺點,那就是由於資料是藉由PCM訊號的方式包裝,如果當硬體誤判DSD為PCM訊號時,就會在88kHz的地方產(chǎn)生一個大約-34db的雜音,並且播放DSD的相關(guān)操作和設(shè)定過程相當繁雜,所以DSD音樂規(guī)格還是相對地不普及。
小結(jié)
相信看完以上的介紹文章,各位讀者對於DSD這個編碼格式都有了一定程度的了解,也許有人會問說:既然DSD有那麼多不便和缺點,為什麼最近突然有一群廠商在推廣DSD音樂格式?
筆者必須在這邊說,沒有一個格式是沒有缺點,端看實際使用和市場的反應(yīng)。不過關(guān)於DSD規(guī)格會在最近被推廣的原因,筆者推測和DSD規(guī)範出現(xiàn)到現(xiàn)在已經(jīng)超過十年有關(guān),大部分的技術(shù)類專利有效期限是十年左右,所以基本上DSD格式現(xiàn)在已經(jīng)成為一個開放式規(guī)格。再來目前主力的推廣DSD的公司,是當初開發(fā)DSD規(guī)格的Andreas Koch所任職的Playback Design,自然會希望能夠?qū)SD音樂推廣開來。
反倒是製造業(yè)界用於轉(zhuǎn)換DSD與PCM標準規(guī)格的瑞士數(shù)位音樂公司W(wǎng)eiss的老闆Daniel Weiss,在兩年前發(fā)表了一份簡短的DSD白皮書,很明白的點出DSD無法後製處理,一定要先轉(zhuǎn)換為PCM訊號,才能進行必要的後製工作。所以在錄音階段,Weiss推薦還是先用PCM格式儲存聲音訊號比較實際。
再順道回過頭看一下當初制定DSD規(guī)範的Sony,目前和日本音響協(xié)會一同制定新的「Hi-Res」認證,仔細閱讀其內(nèi)部規(guī)範後,可以發(fā)現(xiàn)雖然DSD同樣被視為高解析音源,但是在高解析音源的定義中,並沒有對DSD格式做特別著墨,可以推敲出Sony對這個已經(jīng)失去專利主導(dǎo)權(quán)的音訊格式的態(tài)度。
但總體而言,DSD和PCM誰好誰壞並不是真正的重點,它們都只是儲存音樂的一種格式,重要的還是裡面所包含的音樂。因為音樂的感動並不是靠音樂儲存格式來決定,一個儲存格是只要還有足夠的人在繼續(xù)使用,就有它被保留的意義存在。至於DSD和PCM到底誰會成為未來格式的霸主?就讓音樂製作公司來煩惱吧。
總結(jié)
以上是生活随笔為你收集整理的揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 应用网站图标 下载网站图标
- 下一篇: 对于KSWEB使用心得