但轉(zhuǎn)換器其實真的非常重要——將筆記本電腦直接發(fā)出的聲音與通過數(shù)字端口(如USB)連接了優(yōu)質(zhì)的外置轉(zhuǎn)換器的筆記本電腦所發(fā)出的聲音進行比較,會聽到非常明顯的區(qū)別,連接了外置轉(zhuǎn)換器的聲音聽起來肯定會好很多。 想要弄明白模數(shù)和數(shù)模轉(zhuǎn)換器,我們就需要先了解一些基本的音頻基礎知識。聲音由氣壓的變化組成,有像海浪一樣的波峰和波谷,與我們耳朵的聽覺機制相互作用。我們的耳朵會將接收到的聲波信息傳遞到大腦,大腦則負責處理這些信息。從惱人的狗吠聲到交響樂團的演奏聲等等所有的聲音,實質(zhì)上都是形狀和高度各異的波。通常情況下,聲音越復雜,波的形狀就越復雜。從視覺上看,在振幅(水平)與時間的關(guān)系圖中,音頻看起來像一條彎曲的線,我們稱之為波形(如圖1所示)。 圖1:這張圖顯示的是一支管弦樂隊演奏的貝多芬交響曲在被麥克風轉(zhuǎn)換成不同的電壓后所產(chǎn)生的氣壓變化。注意,這是一個非常短的音頻片段,通過放大可以更清楚地顯示波形的形狀。 在黑膠唱片上刻下波形的輪廓就形成了唱片的律動,當我們播放這張唱片時,唱針會跟隨這個波形進行播放,這會使唱機匣產(chǎn)生電壓變化,產(chǎn)生類似于聲音的原始波形,最終驅(qū)動揚聲器發(fā)聲。由于揚聲器音盆會跟隨波形運動,所以它能復制最初壓入黑膠唱片的波形。因為上述的每個階段都會傳輸一個模擬輸入信號的信號——因此便有了“模擬音頻”這個術(shù)語。 不幸的是,跟樂隊成員一樣,模擬音頻也有局限性。例如,黑膠唱片的爆裂聲、滴答聲、扭曲的聲音和表面噪聲會作為不受歡迎的音頻“瑕疵”被添加到原始聲音中。錄音磁帶會添加音染,磁帶上的灰塵會導致砰砰聲和滴答聲,磁帶錄音會有嘶嘶聲,等等。因此,盡管揚聲器輸出的信號與原始錄制的信號相似,但由于模擬錄制、處理和回放中固有的錯誤,也不太可能和原始聲音一模一樣。 耶!數(shù)字音頻確實存在!數(shù)字音頻通過將音頻轉(zhuǎn)換為一串數(shù)字從錄制和播放過程中刪除了許多變量,之后通過音頻鏈傳遞這些數(shù)字(我們稍后會為大家解釋為什么這會改善聲音質(zhì)量)。 模數(shù)轉(zhuǎn)換器會將模擬信號轉(zhuǎn)換為數(shù)字。 圖2A顯示了最終將轉(zhuǎn)換為數(shù)字數(shù)據(jù)的波形。 圖2A. 原始音頻 圖2B. 用特定的采樣速率測量音頻電平。 圖2C為每個測量樣本指定一個數(shù)值,存儲為數(shù)字數(shù)據(jù) 圖2D. 使用平滑濾波器恢復成波形形狀 圖2:模數(shù)轉(zhuǎn)換過程以一致的速率對波形進行采樣,并測量每個樣本的電平并為其指定數(shù)值。 計算機每隔幾微秒就會抓拍一次信號(如圖2B所示),然后將這一系列抓拍或樣本轉(zhuǎn)換成代表信號電平變化的電壓電平(如圖2C所示)。 之后,計算機會對電平進行測量并將它們轉(zhuǎn)換成一串數(shù)字(以數(shù)字數(shù)據(jù)的形式)來定義這些電壓變化。 轉(zhuǎn)換器每秒測量的次數(shù)就是采樣率,也稱為采樣頻率。 我們將其與典型的音頻系統(tǒng)結(jié)合起來進行說明。麥克風會拾取音頻信號并將其發(fā)送到模數(shù)轉(zhuǎn)化器來將音頻信號轉(zhuǎn)化成數(shù)字信號。計算機接收到這一串數(shù)字信息后會對其進行處理 - 例如,在播放之前將其延遲以創(chuàng)建數(shù)字延遲,或?qū)⑵浯鎯υ谟脖P上進行數(shù)字錄制。 到目前為止一切都沒有任何問題,但由于我們聽不了數(shù)字信號,所以必須將錄制或處理的數(shù)字數(shù)據(jù)轉(zhuǎn)換回可以通過揚聲器或耳機播放的模擬信號。 因此,就需要數(shù)模轉(zhuǎn)換器將數(shù)字串轉(zhuǎn)換回一系列電壓電平。 到這兒也還沒結(jié)束,因為我們還需要將這一系列離散電壓平轉(zhuǎn)換成連續(xù)的波形。 我們將低通濾波器與數(shù)模轉(zhuǎn)換器配合使用,來對階梯信號進行過濾,從而使尖銳的波形邊緣變得平滑(如圖2D所示),之后我們就可以將轉(zhuǎn)換好的模擬信號發(fā)送到放大器/揚聲器組合中了。 為什么數(shù)字音頻能夠保持保真度我們以將數(shù)字信號存儲在塑料材質(zhì)的圓盤上的光盤為例:當我們把光盤放進CD機后,激光就會讀取這些數(shù)據(jù),然后將其發(fā)送到數(shù)模轉(zhuǎn)化器,之后數(shù)模轉(zhuǎn)換器就會將數(shù)字信號轉(zhuǎn)換回模擬信號。 因為CD都帶有糾錯功能,所以即使光盤上有輕微的劃痕,它也能識別出來并對丟失的數(shù)據(jù)進行替換,因此通常不會有跳讀的情況發(fā)生。 在您下載音樂時,即使您的互聯(lián)網(wǎng)連接中斷了,下載引擎也會將這些部分組合成一個可以不間斷播放的文件。 對音樂家來說,更重要的是,使用數(shù)字音頻可以讓音頻在通過信號鏈后的音質(zhì)保持不變。 在模擬多軌錄音機的時代,當您將您的歌曲混縮到一個模擬雙軌錄音帶時,會引入了額外的嘶嘶聲和失真。 當您對磁帶進行母版制作時,會引入更過的雜音,將音頻傳輸?shù)揭粋€可以壓制唱片的金屬壓模上時,也會引入砰砰聲、研磨聲和扭曲的聲音。 在每個音頻傳輸階段,信號質(zhì)量都會更加惡化。 使用數(shù)字錄音,您可以將數(shù)字信號混合到立體聲或環(huán)繞立體聲中,從而創(chuàng)建另一組數(shù)字。 (當然,這些數(shù)字也會通過數(shù)模轉(zhuǎn)換器進行監(jiān)聽,因此您可以聽到正在混縮的內(nèi)容。)因此,最終的立體聲混音將代表您混縮歌曲時所聽到的內(nèi)容。 接下來,您可以將通過數(shù)字化混合的數(shù)字串傳到網(wǎng)上(希望是無損的),或?qū)⑵鋸椭频街悄苁謾C的內(nèi)存中,或者將這些數(shù)字信號壓入光盤,等等。 您可以在信號鏈的最初想象模數(shù)轉(zhuǎn)化器把聲音“風干”了起來,聲音直到回到播放系統(tǒng)的數(shù)模轉(zhuǎn)化器時才會被重構(gòu)。 這也是數(shù)字音頻聽起來如此純凈的原因:它沒有遭受模擬信號所遭受的那些修整。 轉(zhuǎn)化器采樣率和分辨率是時候喝杯咖啡休息一下了,因為我們即將要說到的會涉及到更為晦澀的專業(yè)技術(shù)。但是大家一定要堅持看下去,因為接下來的內(nèi)容非常重要。 轉(zhuǎn)換器的采樣率是由高精度、穩(wěn)定的系統(tǒng)時鐘所控制的,是數(shù)字音頻系統(tǒng)最重要的特性之一。如果轉(zhuǎn)換器的采樣率比較高的話,那么您也可以向下使用較低的采樣率,但如果轉(zhuǎn)換器的采樣率比較低的話,您卻不能使用較高的采樣率了。大多數(shù)低成本的轉(zhuǎn)換器的采樣率都是96kHz,不過隨著技術(shù)的發(fā)展,192kHz的采樣率在現(xiàn)代已經(jīng)越來越普遍了。 轉(zhuǎn)換過程的另一個方面是位分辨率(通常稱為字長),它表示的是模數(shù)轉(zhuǎn)化器測量輸入信號的準確程度。 由于每個樣本在那個時刻都會測量信號的電壓,因此測量越精確,從模擬音頻到數(shù)字數(shù)據(jù)的轉(zhuǎn)換就越準確。 就如同尺子的刻度一樣,以英寸為刻度的尺子只能只能確切地用英寸測量長度,但是,用十六分之一英寸刻度的尺子來測量長度的話,那么分辨率就可以提高16倍。 位數(shù)越高,分辨率也就越高。 不同的音頻系統(tǒng)分辨率也不盡相同。更高的分辨率需要更多的存儲空間來存儲大量的數(shù)字信號,以及更高的模數(shù)轉(zhuǎn)化器精確度來實現(xiàn)這些更高的分辨率。隨著內(nèi)存和轉(zhuǎn)換器變得越來越便宜,設備們的位分辨率也越來越高了。例如,音頻賀卡的音頻可能只有4位分辨率。早期的數(shù)字音頻系統(tǒng)使用8位,后來發(fā)展到12位。 CD使用16位分辨率,“高分辨率”音頻使用24位分辨率。雖然24位音頻文件在相同采樣率下比16位音頻文件多占50%的存儲空間,但大多數(shù)錄音工程師都認為24位的音頻文件要比16位音頻文件的音質(zhì)要好很多。(一個有趣的事實:也許人們最初認為CD聽起來比比黑膠唱片差的一個原因是,盡管CD具有16位分辨率,但早期的播放器通常使用12位轉(zhuǎn)換器。) 位分辨率越低,失真越大 - 如果你不能準確地測量一個信號,那么你就不能準確地再現(xiàn)它。然而,與物理世界(失真往往隨著信號電平的升高而增加)中的失真不同,數(shù)字失真會隨著信號電平的降低而增加,因為可用于表示音頻波形的比特非常少(如圖3所示)。 圖3:高振幅分辨率與低振幅分辨率——對于固定分辨率,如圖以24位為例,相比較低振幅信號(右),您可以設定一個更高精度(位數(shù)更高)的高振幅信號(左)。 幸運的是,不管怎樣,失真在回放時的電平是非常低的,并且抖動也能進一步降低我們對低失真的感知。 此外,錄音/混音程序中的音頻引擎也不受轉(zhuǎn)換器硬件規(guī)則的約束,并且一旦信號進入計算機內(nèi),就可以提供本質(zhì)上無限的分辨率。 為什么數(shù)字轉(zhuǎn)換器的動態(tài)余量很重要?雖然您的軟件的音頻引擎具有幾乎無限的動態(tài)范圍,但處理進出您計算機的音頻的轉(zhuǎn)換器卻沒有。因此,我們要留出些動態(tài)余量 - 信號峰值與模數(shù)轉(zhuǎn)化器或數(shù)模轉(zhuǎn)化器可以處理的最大電平之間的電平差。例如,如果在您錄音時信號的峰值在軟件的虛擬電平表上達到0,那么說明音頻接口的轉(zhuǎn)換器中沒有更多的可用動態(tài)余量。調(diào)高音頻接口的電平將產(chǎn)生失真。但如果信號的峰值在軟件的虛擬電平表上顯示為-6dB,那么就表示在失真前我們有6dB的動態(tài)余量。在錄音時,許多工程師都會將數(shù)字音頻電平設置為低于0dBFS的6dB(或更低的峰值電平- 12db或- 15db也非常常見)。這可以適應意料之外的峰值,但是有些人也覺得這些電平達到了模數(shù)轉(zhuǎn)化器或數(shù)模轉(zhuǎn)化器的“最佳點”,在最高和最低電平時表現(xiàn)可能都不那么好。 在混音時,主輸出要留有幾dB余量的一個原因是,大多數(shù)數(shù)字測量儀測量的是數(shù)字音頻樣本的電平。但是,將數(shù)字音頻轉(zhuǎn)換回模擬可能會產(chǎn)生比樣本本身更高的電平值,這會造成樣本間失真(如圖4所示)。 圖4A:正在被采樣的原始音頻 圖4B:提高到0db后的最高采樣電平 圖4C:經(jīng)過平滑濾波器后,信號超過0db 圖4:(A)中采樣的模擬音頻波形用紅點表示被測樣本電平。當通過平滑濾波器(C)重構(gòu)模擬波形時,將數(shù)字音頻樣本的電平提高到最大可用動態(tài)余量(B)可以超過數(shù)模轉(zhuǎn)換器的最大動態(tài)余量(C)。 因此,(C)中曲線的紅色部分將被剪裁掉。 除非您通道的電平表具有能夠提醒您采樣間失真的功能,否則請留出幾dB的余量來避免這種情況。 此外,您也不需要將電平調(diào)到最高,因為在現(xiàn)今的流媒體世界中,諸如YouTube和Spotify等都會調(diào)整音頻,使其達到一致的感知電平。 數(shù)字音頻的限制和解決方案當CD第一次出現(xiàn)的時候,它的宣傳口號是“永遠完美的聲音”—一個誰都會喜歡的營銷口號。然而,雖然數(shù)字音頻總體上要比模擬音頻好,但它仍不是完美的。 采樣率問題。如果系統(tǒng)不能以足夠高的采樣頻率對信號電平進行采樣的話,就很難準確地再現(xiàn)信號。采樣率必須至少是進入系統(tǒng)的最高音頻頻率的兩倍,因此44.1kHz是錄音的最低的采樣率。 輸出濾波器音染。如上所述,post-DAC低通濾波器會將階梯采樣轉(zhuǎn)換為平滑連續(xù)的信號。 但是,濾波器可能會添加自己的音染。 分辨率(量化)錯誤。 如果數(shù)字音頻系統(tǒng)能夠以1毫伏(mV或1/1000伏特)的精度測量電平,則1mV的電平將被指定為一個數(shù)字,2mV的電平將被指定為一個數(shù)字,3mV的電平將指定為一個數(shù)字,以此類推。 現(xiàn)在假設計算機試圖測量1.5mV信號 - 計算機無法解析該值,因此它必須指定一個1mV或2mV的值。 在這兩種情況下,樣本與原始輸入電平都不能完全對應,這就會產(chǎn)生錯誤。雖然實際的精確度要比這個例子好得多,但是仍然有可能出錯。 非線性。非線性是用來描述如果不同的量化級別之間的間隔不是均等的,那么就會出現(xiàn)誤差的情況。讓我們回顧下前面的例子,我們假設能夠測量到1毫伏的精度?;氐角懊娴睦?,我們假設能夠測量到1毫伏的精度。但如果存在非線性,轉(zhuǎn)換器可能會將1毫伏信號轉(zhuǎn)換為1.001毫伏,2毫伏信號轉(zhuǎn)換為1.978毫伏,等等。這些誤差會改變波形形狀,從而導致失真。 動態(tài)范圍限制。從理論上講,24位分辨率具有大約144dB的動態(tài)范圍(每位大約6dB)。但在現(xiàn)實世界中,由于噪聲,電路板布局問題,電源限制和制造公差等因素的影響,24位的轉(zhuǎn)換超出了轉(zhuǎn)換器解決高動態(tài)范圍的能力,所以實際分辨率更可能是20到22位。 抖動。如果提供采樣率的系統(tǒng)時鐘不穩(wěn)定,則不會以相同的時間間隔捕獲或回放表示數(shù)字音頻的樣本。您可以將其視為“時間失真”,因為您沒有在正確的時間聽到正確的樣本。這會導致細微的失真,這也是在兩個不同的數(shù)模轉(zhuǎn)換器上回放相同的數(shù)字音頻可能聽起來不同的原因之一 -- 一個可能具有更高的抖動,而另一個具有更低的抖動。 偏移和增益誤差。即使沒有輸入電平,偏移也會產(chǎn)生輸出電壓。高端的轉(zhuǎn)換器在加工完成后,通常還會對轉(zhuǎn)換器的內(nèi)部電路進行修整以消除偏移。當輸出電壓高于或低于理論上的值時,轉(zhuǎn)換器也可能存在增益誤差。對于這些問題,目前并沒有什么好的解決方法,但是人們在設計高端的轉(zhuǎn)換器時,通常會在最小化電壓偏移和增益誤差上下很大功夫。 雖然數(shù)字音頻可能并不完美,但它確是最接近完美的 - 并且還在不斷改進。然而,僅僅因為某些東西是“數(shù)字的”并不意味著您能享受到數(shù)字音頻所有的優(yōu)勢。智能手機或其他消費類設備中的轉(zhuǎn)換器與專用音頻轉(zhuǎn)換器是不在一個級別上的。 例如,Dangerous Music的Convert-8是一款高端的8通道數(shù)模轉(zhuǎn)換器,具有良好的規(guī)格參數(shù):114dB動態(tài)范圍(信噪比),總諧波失真+噪聲(unweighted) 0.00188%at + 4dBu,低于0.0004%at + 22dBu,串擾抑制(從一個通道泄漏到另一個通道)在1kHz時超過114dBu,時鐘抖動低于16微微秒(從100Hz到40kHz)。如果您不知道這些規(guī)格的真正含義的話,只需說它們非常棒就足夠了。但請注意,雖然這些參數(shù)都是非常明確的,但并非所有公司都會如此嚴格的規(guī)范。例如,它們可能會產(chǎn)生串擾,但哪個頻率產(chǎn)生串擾的可能性最低就沒有在參數(shù)表里提及,所以最重要的是要用耳朵去聽,而不是用眼睛去看。 好在現(xiàn)代的轉(zhuǎn)換器芯片的質(zhì)量要遠遠優(yōu)于80年代和90年代。 即使是低成本的音頻接口也會有可觀的規(guī)格參數(shù),所以我們在現(xiàn)在很難能找到“糟糕”的專業(yè)音頻接口,但如果您有足夠的預算來購置高端的轉(zhuǎn)換器的話,那么您就能得到開放度更高、聲音更通透、更具空氣感的聲音。 雖然數(shù)字音頻優(yōu)勢多多,但它還是要在模擬世界來回轉(zhuǎn)換 - 而這也是用來區(qū)分高端轉(zhuǎn)換器與“所謂好的”轉(zhuǎn)換器的關(guān)鍵。 |
|