400-012-8816

服務支持

Service support

【名詞解釋】數(shù)字音頻
發(fā)布日期:2019-2-28   點擊次數(shù):

數(shù)字音頻是通過電腦以及數(shù)字設備等方式來表示模擬信號,并將其進行錄制、回放的一種方法。與視頻的幀類似,數(shù)字音頻也是由一系列的采樣樣本組成的,聲音的回放其實就是這些樣本序列的再構(gòu)成。數(shù)字音頻有許多不同的格式,不同格式的數(shù)字音頻則是有著不同的保真度和動態(tài)范圍。


數(shù)字音頻本質(zhì)上來講是有限的。聲學聲音和模擬信號都是由實際存在的、流動著的波形構(gòu)成的,而數(shù)字信號則是實際存在著的物體的近似值。就像由無數(shù)的幀組成的視頻一樣,數(shù)字音頻也是由一系列的采樣樣本構(gòu)成的。


本文將會著重介紹脈沖編碼調(diào)制(PCM),這是最常用的數(shù)字音頻編碼系統(tǒng)。而其他的系統(tǒng),諸如DTS以及杜比數(shù)字等,則在電影和技術行業(yè)更為常用。


數(shù)字音頻編碼系統(tǒng)

Avid Pro Tools


在PCM音頻系統(tǒng)中,信號每秒被多次采樣,每個采樣都記錄了某一特定時刻波的振幅。由于模擬波形并不能被完美無缺地重建,因此每個采樣都是取的近似值。而當這些樣本按順序播放時,便可以準確地重新再現(xiàn)聲音。


與模擬音頻中用頻率和振幅兩個要素來定義聲音一樣,數(shù)字音頻也有兩個主要的參數(shù):采樣率和位深度。采樣率指的是聲音每秒被采樣的次數(shù),而位深度指的則是每個采樣所能夠捕獲的動態(tài)范圍量。


CD的標準采樣率為44.1kHz,看上去這個數(shù)字好像是一個很隨機的選擇,但是其實根據(jù)奈奎斯特的香農(nóng)采樣定理,采樣率必須要高于捕獲最高頻率的兩倍。而人耳的聽覺上限是20kHz,因此需要大于40kHz的采樣率才能捕獲整個范圍(而額外的4.1kHz則是為了避免一種名為“混疊”的失真現(xiàn)象)。


理論上,44.1kHz的采樣率已經(jīng)足夠我們準確地再現(xiàn)任何聲音了,但是還是有更高的采樣率的存在。


另一種最為常見的采樣率便是48kHz,它是電影以及視頻聲音的主要標準。這是因為它的設計與現(xiàn)有的每秒24幀的電影幀速率標準相互集成。而與奈奎斯特頻率類似,24幀是剛好可以使得一系列圖像看起來像是流暢的運動圖像的神奇數(shù)字。


而音頻采樣率必須要是幀速率的倍數(shù),才能保持同步,44.1kHz會隨著時間的推移而導致明顯的音畫不同步現(xiàn)象,因此48kHz的采樣率最為合適。


更高的采樣率也被廣泛使用,但這些采樣率的必要性卻飽受爭議。支持者稱超高頻率的采樣率巧妙增加了保真度,并為信號添加了“味道”;而反對者則認為,44.1已經(jīng)足夠,而且采樣率越高,文件大小也會越大,并且在抖動到較低采樣率時,會無可避免地產(chǎn)生“偽陰影”。


這些更高的采樣率通常都是44.1或者48的倍數(shù),例如88.2、96以及192kHz都是現(xiàn)代設備和軟件中常用的采樣率選項。

數(shù)字音頻圖


比特深度決定了文件的動態(tài)分辨率,類似數(shù)碼照片那樣。每個“比特”可以傳送4個振幅數(shù)值(兩個正值兩個負值),因此每個樣本所含的比特越多,也就代表著動態(tài)范圍越大。


這并不意味著,比特深度越高,音量就會越大;但是,更高的比特深度聽起來會更加真實,因為它們可以做到更加準確地再現(xiàn)聲音(就好比高分辨率的照片)。以下是常見采樣率及其統(tǒng)計數(shù)據(jù)的概述:


4-bit:16個數(shù)值,24dB的動態(tài)范圍。有時也會用于極低保真的“bitcrushed”效果器上。


8-bit:256個數(shù)值,48dB的動態(tài)范圍。經(jīng)常用于早期的經(jīng)典的視頻游戲系統(tǒng)。


16-bit:65536個數(shù)值,96dB的動態(tài)范圍,CD音頻的標準比特深度。


24-bit:16777216個數(shù)值,145dB的動態(tài)范圍,最常用的比特深度。


32或者 64-bit:“浮點”,目前可以做到提供最佳信噪比的數(shù)值,但是尚未被廣泛采用。


PCM音頻可以為用戶提供多種格式的編碼,這些格式分為兩大類:有損和無損。無損格式完美保留了錄制時捕獲的任何信息,但會占用較大的硬盤空間。


有損格式會創(chuàng)建壓縮文件(注意,數(shù)據(jù)的壓縮和音頻的“壓縮”是不一樣的),有損格式的文件占用的硬盤空間會明顯減少,但是同樣會犧牲一部分音質(zhì),甚至會產(chǎn)生“偽陰影”。以下是常用的文件格式的概述:


無損格式

WAV (波形音頻文件格式):錄音設備在錄制原始未壓縮音頻文件時的常用格式。廣播WAV文件(.BWF)可以存儲大量的額外元數(shù)據(jù)。


AIFF(音頻交換文件格式):和WAV相似,是apple設備專用格式。


FLAC(免費無損音頻編解碼器):一種開源格式,可以在不犧牲音質(zhì)的前提下對文件進行壓縮,但是并非所有播放器都支持。


ALAC(Apple無損音頻編解碼器):效率略遜色于FLAC,Apple設備專用。


有損格式

mp3(Mpeg音頻層III)迄今為止最常見的壓縮文件格式,在便攜式音樂播放器問世時得到普及。


AAC(高級音頻編碼)一種旨在提高mp3質(zhì)量的替代方案。


OGG (Ogg Vorbis)維基百科、Spotify 以及某些視頻游戲的開源替代品,但是個人用戶使用并不方便。(有趣的是,Vorbis其實是Terry Pratchett筆下的Discworldbook系列中的一個登場角色。)

分享: