解析音頻編解碼器技術(shù)
出處:paulsimons 發(fā)布于:2011-09-05 14:52:25
一些音頻編碼解碼器芯片主要由圍繞一些處理硬件的一個模數(shù)轉(zhuǎn)換器(ADC)和一個數(shù)模轉(zhuǎn)換器(DAC)組成,但它們只是眾所周知的海底冰山露出來的一角。一般來說,音頻解碼器分為兩類,一類是用于Hi-Fi聽音的純音頻解碼器,即指把CD機等數(shù)字音源器材一分為二后,去掉轉(zhuǎn)盤(驅(qū)動光碟旋轉(zhuǎn)讀盤)的部分。近一段時間,大部分工程師認(rèn)為音頻編解碼器就是在DSP平臺上運行的壓縮和解壓縮算法。在整個音頻頻率范圍里,“語音”編解碼器適合數(shù)字電話應(yīng)用,而“音頻”編解碼器則適合娛樂音頻應(yīng)用。
在這個意義上,音頻編解碼器是從Dolby公司的噪音抑制技術(shù)演變成Dolby和其它一些公司更綜合性的壓縮方法。它們的出現(xiàn)還與國際標(biāo)準(zhǔn)組織(ISO)的運動圖像小組(MPEG)有關(guān),該工作小組負(fù)責(zé)為數(shù)字音頻和視頻的編碼表示制定相應(yīng)的標(biāo)準(zhǔn)。
純音頻解碼器的主要作用是把讀取的數(shù)字音頻信息轉(zhuǎn)換成模擬音頻信號輸出,供功率放大重放。因此嚴(yán)格說純音頻解碼器應(yīng)稱作D/A(數(shù)字/模擬)轉(zhuǎn)換器。另一類即AV影音解碼器,即平常所說的在“家庭影院”設(shè)備中使用的解碼器,主要作用是把錄音時經(jīng)過編碼的多聲道音頻信息作解碼還原,經(jīng)D/A轉(zhuǎn)換后供功率放大重放。例如,朝更多的環(huán)繞聲通道發(fā)展就是一個趨勢。的一個技術(shù)趨勢是增加了用于模擬立體聲系統(tǒng)中的多通道音頻的技術(shù),以再造特別實況音樂會會場的“現(xiàn)場感”。于是產(chǎn)生了完成所有這些處理的挑戰(zhàn),因為你不再能用依靠AV接收器或DVD播放器內(nèi)的大功率電源供電的DSP引擎來實現(xiàn),而必須用靠手機或PDA中的電池供電的DSP引擎來實現(xiàn)。所有上述因素就為兩個不同但卻融合的應(yīng)用領(lǐng)域(個人音頻和家庭影院)帶來了一個有趣的故事。盡管語音編解碼器技術(shù)的發(fā)展一定程度上處于靜止?fàn)顟B(tài),但音頻編解碼器技術(shù)一直在向前演進(參見圖1)。

個人音頻
德州儀器公司(TI)便攜音頻和信息娛樂業(yè)務(wù)部技術(shù)官RandyCole指出,在個人音頻領(lǐng)域普遍的音頻編碼解碼器是MP3(參見圖2)。MP3全稱是動態(tài)影像壓縮標(biāo)準(zhǔn)音頻層面3(Moving Picture Experts Group Audio Layer III)。是當(dāng)今較流行的一種數(shù)字音頻編碼和有損壓縮格式,它設(shè)計用來大幅度地降低音頻數(shù)據(jù)量,而對于大多數(shù)用戶來說重放的音質(zhì)與初的不壓縮音頻相比沒有明顯的下降。它是在1991年由位于德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發(fā)明和標(biāo)準(zhǔn)化的。MP3一度局限于PC和便攜多媒體播放器,但它目前在手機行業(yè)中也比比皆是,其原因就是手機制造商不斷地追逐新功能,以誘使終用戶每隔六個月就進行產(chǎn)品換代。
MP3是ISO公布的一項標(biāo)準(zhǔn)。它是由MPEG制定的MPEG-1編碼解碼標(biāo)準(zhǔn)系列中的第三個。MPEG-1有三層,每一層都包括前面的層。因而,第3層實現(xiàn)了第1和2層。出于這個原因,MPEG-1及第3層就是眾所周知的MP3,它提供了一個適于便攜應(yīng)用的帶寬和數(shù)據(jù)速率,雖然較低卻足夠了。

簡單地說,MP3就是一種音頻壓縮技術(shù),由于這種壓縮方式的全稱叫MPEG Audio Layer3,所以人們把它簡稱為MP3。MP3是利用 MPEG Audio Layer 3 的技術(shù),將音樂以1:10 甚至 1:12 的壓縮率,壓縮成容量較小的file,換句話說,能夠在音質(zhì)丟失很小的情況下把文件壓縮到更小的程度。而且還非常好的保持了原來的音質(zhì)。正是因為MP3體積小,音質(zhì)高的特點使得MP3格式幾乎成為網(wǎng)上音樂的代名詞。每分鐘音樂的MP3格式只有1MB左右大小,這樣每首歌的大小只有3-4兆字節(jié)。使用MP3播放器對MP3文件進行實時的解壓縮(解碼),這樣,高品質(zhì)的MP3音樂就播放出來了。
因此,由于整個行業(yè)深深卷入MP3,沒有一家公司愿意調(diào)撥資源為AAC這個新方案生產(chǎn)大量的音頻節(jié)目,所以它衰敗了。
一種大家熟悉的專有編碼器是WindowsMediaAudio(WMA)。它主要用于PC,并在其中與MP3和AAC進行競爭。然而,從數(shù)據(jù)速率看,它很靈活(從低到高有適當(dāng)?shù)馁|(zhì)量差異)。目前,還有WMA的多頻道版本W(wǎng)MA-Pro,而且微軟公司在2005年6月還發(fā)布了一種損耗更低的WMA。
其它重要的專有編碼器就是DolbyDigital,也就是著名的AC3。這種編碼器用于DVD和(美國的)數(shù)字電視。直到近,它的運行速率對互聯(lián)網(wǎng)和手機來說還是太高。不過,需要補救的是一個把數(shù)據(jù)速率降得更低的新版本。
根據(jù)TI公司高性能音頻業(yè)務(wù)部行銷經(jīng)理MohsinImtiaz的觀點,在家庭影院領(lǐng)域主要的編碼解碼器是Dolby和DTS。Dolby公司發(fā)布的DolbyDigitalPlus瞄準(zhǔn)了高清晰度DVD和廣播市場。但是在MP3、AAC、WMA等便攜標(biāo)準(zhǔn)之間有一定的交叉。針對下一代DVD,微軟公司正在力推WMA。WMA(Windows Media Audio),它是微軟公司推出的與MP3格式齊名的一種新的音頻格式。由于WMA在壓縮比和音質(zhì)方面都超過了MP3,更是遠(yuǎn)勝于RA(Real Audio),即使在較低的采樣頻率下也能產(chǎn)生較好的音質(zhì)。一般使用Windows Media Audio編碼格式的文件以WMA作為擴展名,一些使用Windows Media Audio編碼格式編碼其所有內(nèi)容的純音頻ASF文件也使用WMA作為擴展名。
解析一個編解碼器
我們看一篇在2004年10月音頻工程學(xué)會年會上提交的論文,它描述的是DolbyDigitalPlus技術(shù)。
該論文說新的DolbyDigitalPlus編碼解碼器是基于DolbyDigital的較早版本,也叫AC-3。DolbyDigitalPlus或加強型的AC-3(E-AC-3)保留了元數(shù)據(jù)載運器、過濾器庫和幀結(jié)構(gòu)。目前的數(shù)據(jù)速率范圍從32Kb/s到6.144Mb/s。在采樣速率32KHz和六模塊轉(zhuǎn)換幀的條件下,數(shù)據(jù)速率控制的分辨率可達到每秒1/3位。(數(shù)據(jù)速率的分辨率正比于采樣速率,反比于幀的尺寸。)
E-AC-3保留了AC-3的六個256系數(shù)轉(zhuǎn)換幀結(jié)構(gòu),但它允許包含一個、兩個和三個256系數(shù)轉(zhuǎn)換模塊的較短幀存在。其結(jié)果就是,音頻傳輸可以在高于6?0Kb/s的速率下進行,這適合于某些限制了每幀數(shù)據(jù)量的DVD。
濾波器(filter),是一種用來消除干擾雜訊的器件,將輸入或輸出經(jīng)過過濾而得到純凈的直流電。對特定頻率的頻點或該頻點以外的頻率進行有效濾除的電路,就是濾波器,其功能就是得到一個特定頻率或消除一個特定頻率。編碼效率的提高還可以通過一個新的濾波器庫、更好的量化、強化的頻道耦合、譜擴展和一種名為“瞬態(tài)預(yù)噪音處理”的技術(shù)來實現(xiàn)。
當(dāng)具有穩(wěn)定特征的音頻出現(xiàn)時,該濾波器庫在現(xiàn)有的AC-3濾波器庫之后加入一個二級DCT。這把六個256系數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換成一個單一的1536系數(shù)混合轉(zhuǎn)換模塊,且提高了頻率分辨率。這個提高的頻率分辨率與六維向量分量(VQ)及增益自適應(yīng)分量(GAQ)結(jié)合在一起可以改進“難于編碼”信號的編碼效率,比如說黑管和大鍵琴。
VQ用于需要較低準(zhǔn)確度的頻帶區(qū)。當(dāng)需要更高準(zhǔn)確度分量時,GAQ更有效率。在AC-3用一個高頻單合成頻道作為每個頻道上高頻部分的地方,加入相位信息和編碼器控制的譜幅度處理能夠讓這個高頻單合成頻道處理較低的頻率,從而減小了有效的編碼帶寬并增大了編碼效率。
譜擴展是用頻域上轉(zhuǎn)換的較低頻譜段代替了較高層的頻率轉(zhuǎn)換系數(shù)。該轉(zhuǎn)換頻譜段的譜特征通過轉(zhuǎn)換系數(shù)的譜調(diào)制與原始的形式匹配。
由編碼器計算并在E-AC-3位流中發(fā)送的元數(shù)據(jù)提供了后解碼過程、時標(biāo)合成處理所需的參數(shù),時標(biāo)合成處理使用了聽覺情景分析技術(shù)。
后處理
用于音頻編碼解碼器中后處理的專有算法與DolbyDigitalPlus這類壓縮標(biāo)準(zhǔn)一樣重要,它們對任何受許可人也相同。在這個領(lǐng)域中,這些算法對多頻道標(biāo)準(zhǔn)攜帶的信息進行操作,從而把家庭影院轉(zhuǎn)化成任何形式的收聽場所:從一個巨大的教堂到一個爵士音樂俱樂部的戶外搖滾音樂會。爵士樂(Jazz),一種起源于非洲的音樂形式,由民歌發(fā)展而來。爵士樂以多種形式呈現(xiàn)出繁榮景象,其樂曲風(fēng)格極其耀眼,節(jié)奏一般以鮮明,強烈為主,從根源布魯斯、拉格泰姆(Ragtime),經(jīng)過新奧爾良爵士樂到Dixieland爵士樂、搖擺樂、主流爵士、比波普、現(xiàn)代爵士到自由爵士及電子爵士。
按照ADI公司SigmaDSP產(chǎn)品經(jīng)理ThomasIrrgang的說法,后處理全都是圍繞著OEM商追求一個“簽名聲音”的愿望開展的。OEM生產(chǎn),即代工生產(chǎn),也稱為定點生產(chǎn),俗稱代工,基本含義為品牌生產(chǎn)者不直接生產(chǎn)產(chǎn)品,而是利用自己掌握的關(guān)鍵的技術(shù)負(fù)責(zé)設(shè)計和開發(fā)新產(chǎn)品,控制銷售渠道,具體的加工任務(wù)通過合同訂購的方式委托同類產(chǎn)品的其他廠家生產(chǎn)。之后將所訂產(chǎn)品低價買斷,并直接貼上自己的品牌商標(biāo)。這種委托他人生產(chǎn)的合作方式簡稱OEM,承接加工任務(wù)的制造商被稱為OEM廠商,其生產(chǎn)的產(chǎn)品被稱為OEM產(chǎn)品??梢?,定點生產(chǎn)屬于加工貿(mào)易中的“代工生產(chǎn)”方式,在國際貿(mào)易中是以商品為載體的勞務(wù)出口。大概做成功這點的是THX公司。其它開展后處理研究的公司包括SRS、TruSurroundXT和TruBass。
在電視領(lǐng)域有包括BBE3D和BBEMP。還有一種專門用于電視的算法BBEViva,在電視中立體聲話筒一般放置的非常近以便獲得良好的立體聲收聽效果。
目前突出的是WAVES公司的MaxxBass算法,它大概也是的低音增強算法,因為它增強了正被處理材料中低音的主觀感受水平,同時又不加入任何低頻能量。低音增強在便攜系統(tǒng)和電視機中正變得重要起來,這些設(shè)備不會給大的話筒驅(qū)動器留有大的空間。
Dolby公司在后處理領(lǐng)域以其VirtualSpeaker(虛擬話筒)和DolbyHeadphone(Dolby耳麥)算法而聞名于世。Dolby公司表示其技術(shù)復(fù)制了多個所以聲音簽名,包括反射,同時提供了串?dāng)_抵消,以便保持每個耳朵的環(huán)繞音質(zhì)不被其它話筒的環(huán)繞音質(zhì)所抵消。
當(dāng)然,天下沒有的午餐。諸如虛擬話筒這樣的算法只能在一個相對小的室內(nèi)空間(俗稱“甜場”)中模仿缺失話筒的存在。在這個“甜場”之外,環(huán)繞信息崩潰了。該聲音不算壞,但聽起來它來自一個常規(guī)的雙耳話筒設(shè)置,情況就是這樣。
為了重新生成一個物理空間,Panasonic公司的網(wǎng)站上說,其HallMode(大廳模式)“再生了回響效果,使聽眾有一種空曠之音繞著自己傳播的感覺,”而且它在“享受音樂廳內(nèi)的交響樂表演時的效果尤其好。”一個雅馬哈A/V接收器的評論家認(rèn)為雅馬哈(雅馬哈 YAMAHA (JAPAN)雅馬哈名字的由來是公司創(chuàng)始人山葉(雅馬哈)寅楠的姓氏,于1887年創(chuàng)立。由于從年輕時就熟悉西方的科學(xué)技術(shù),雅馬哈初修理醫(yī)療設(shè)備,還修理風(fēng)琴,終促成了雅馬哈品牌的誕生。出于對事業(yè)前景的自信,雅馬哈排除萬難,創(chuàng)建了雅馬哈風(fēng)琴公司)的音樂廳“的確加入了額外的一維,使人感到聲場的高度,‘音樂廳模式’甚至讓你忍不住要嘗試一下。對于令人喜愛的Mahler第四交響樂的立體聲錄音,‘音樂廳模式’給人一種親臨現(xiàn)場的感覺?!?/P>
房間修正
這個功能開始出現(xiàn)于2002年或2003年的高端多頻道系統(tǒng)中,而且目前已經(jīng)發(fā)展到處于價格/性能譜系中端的系統(tǒng)。它對一套公寓樓內(nèi)家庭影院系統(tǒng)的用戶滿意度至關(guān)重要,因為在家庭影院系統(tǒng)中不可能對稱設(shè)置左、右話筒,或者說房間內(nèi)一堵墻的聲學(xué)性能不同于它對面墻的聲學(xué)性能。它也許對兩頻道設(shè)置的影響較小,但立體聲系統(tǒng)一般說來對誤調(diào)整和誤校準(zhǔn)不那么敏感。根據(jù)MPEG規(guī)范的說法,MPEG-4中的AAC(Advanced audio coding)將是MP3格式的下一代,盡管有許多創(chuàng)造和推廣其他格式的重要努力。然而,由于MP3的空前的流行,任何其他格式的成功在目前來說都是不太可能的。MP3不僅有廣泛的用戶端軟件支持,也有很多的硬件支持比如便攜式媒體播放器(指MP3播放器)DVD和CD播放器。MP3的播放跟DVD不一樣。
執(zhí)行軟件以驗證其滿足指定的需求并檢測錯誤的過程。檢測已有條件之間的不同,并評價軟件項的特性軟件項的分析過程。軟件工程過程的一個活動,它將軟件在預(yù)定的條件下運行以判斷軟件是否符合預(yù)期結(jié)果。 房間修正涉及到把該系統(tǒng)調(diào)整為TEST(測試)模式,在喜歡的傾聽位置處放一個麥克風(fēng),并播放出一系列測試聲音以便弄清楚房間聲學(xué)性能方面的信息和話筒本身的局限性,隨后根據(jù)專有算法調(diào)整增益和均衡度。對于房間整定技術(shù),一個令人感興趣的交叉領(lǐng)域是汽車應(yīng)用。多年來,一直在對昂貴汽車內(nèi)OEM的音響系統(tǒng)進行聲學(xué)調(diào)整以便獲得性能,但這是一個相當(dāng)費力而且相當(dāng)主觀的人工過程。
汽車制造商已經(jīng)開始采用自動的聽覺空間調(diào)整。實踐證明,除了豐富的聽覺經(jīng)驗外,這類調(diào)整一個重要的方面就是聲學(xué)上的回音抵消。這意味著消除從免手拿話筒到安裝在太陽帽或頭頂處麥克風(fēng)的反饋。
手機和個人多媒體設(shè)備的融合
MP3和AAC數(shù)據(jù)速率對個人多媒體播放器及PC是恰當(dāng)?shù)摹5珜τ谑謾C來說,數(shù)據(jù)速率必須要低一些。而且顯而易見的是,與音樂文件以便稍后播放相比,通過蜂窩網(wǎng)鏈接的流音頻有著很不同的需求。MP3播放器都是由兩塊或兩塊以上的線路板組成,線路板與線路板之間多使用插排件進行連接,在經(jīng)過長時間使用后,這個插排有可能會出現(xiàn)接觸不良現(xiàn)像,而由此帶來的故障現(xiàn)像可能是多種的,嚴(yán)重時就根本無法開機。當(dāng)然這樣的問題一般維修也比較簡單,可以直接將插排拔下,然后使用毛刷沾上無水酒精進行清洗,反復(fù)清洗幾次后便可以把觸點的接觸不良現(xiàn)像去除,如果還是無法使用,可出售給回收電子的企業(yè),讓其進行環(huán)保處理。
由第3代合作規(guī)劃委員會(3GPP)制訂的3G手機標(biāo)準(zhǔn)采用AAC作為音頻編碼解碼器標(biāo)準(zhǔn),可滿足了這兩類應(yīng)用的要求。該標(biāo)準(zhǔn)的修改版(版本6)允許使用兩種音頻編碼解碼器中的任何一種。一種就是AAC的強化版,叫做AAC-Plus或高效率AAC(HE-AAC)。
前不久,強化AAC-Plus或高效率AAC的第二套改進版(版本2)也添加進來。另一種選擇是“AMRWidebandPlus”,它是一種強化的語音編碼器。
蘇格蘭的Wolfson微電子公司從事硬件音頻編碼解碼器的制造,該公司新產(chǎn)品開發(fā)部的副總裁PeterFrith指出,給手機加入回放MP3的功能,或者用于音樂,或者作為高質(zhì)量的鈴聲,意味著用戶已經(jīng)希望在手機中看到一個相對高保真的回放系統(tǒng)。因此,手機制造商目前期盼出現(xiàn)功耗甚至更低的便攜式DAC,且能夠達到100dB的信噪比。
目前,帶多媒體功能的手機只能播放MP3。MP3是一個數(shù)據(jù)壓縮格式。它丟棄掉脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù)中對人類聽覺不重要的數(shù)據(jù)(類似于JPEG是一個有損圖像壓縮),從而達到了小得多的文件大小。下一步要做的也許是個人多媒體播放器,它們能把手機的功能和藍(lán)牙及Wi-Fi技術(shù)結(jié)合在一起。在此期間,PDA電話已經(jīng)逐步進入領(lǐng)域,它提供了一些播放視頻或音頻文件的功能。
那是你口袋里的合唱隊嗎?
Frith還表示,在過去,設(shè)計人員提供的手機只有非常簡單的鈴聲或者MIDI鈴聲功能。有了MIDI,硬件解決方案總的來看已經(jīng)發(fā)展成一個獨立的MIDI解碼器芯片。
雅馬哈是個典型的例子,芯片對MIDI文件進行解碼,并將解碼結(jié)果轉(zhuǎn)換成PCM音頻文件,隨后通過一個DAC把它們播放出來。這個DAC也許可以集成進該解碼芯片之中,當(dāng)然也可以是分立的。做到這點的一個替代方法是把軟件MIDI解碼器植入電話處理器之中。
用戶對播放高質(zhì)量鈴聲的興趣已經(jīng)導(dǎo)致日本市場上的某些電話為其鈴聲選用了MP3文件。在MP3[1]中使用了許多技術(shù)其中包括心理聲學(xué)以確定音頻的哪一部分可以丟棄。MP3音頻可以按照不同的位速進行壓縮,提供了在數(shù)據(jù)大小和聲音質(zhì)量之間進行權(quán)衡的一個范圍。

在目前的大部分電話之中,這個高保真系統(tǒng)是一個獨立的芯片,它含有一個立體聲DAC、一個立體聲ADC、若干耳機和揚聲器驅(qū)動器、麥克風(fēng)預(yù)放大器等等。但類似Wolfson這樣的公司目前尋求把所有這一切都集成在一起,以便該處理器可以實現(xiàn)語音播放和鈴聲、語音信號、藍(lán)牙連接以及更多的功能(參見圖3)。
版權(quán)與免責(zé)聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://www.hbjingang.com,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- 數(shù)字電源控制與傳統(tǒng)模擬控制的深度對比2026/2/2 11:06:56
- 模擬信號調(diào)理電路技術(shù)設(shè)計與選型運維指南2025/12/30 10:08:16
- 運算放大器壓擺率的核心要點2025/9/5 16:27:55
- 深度剖析放大器穩(wěn)定系數(shù) K 與 Mu 的差異2025/9/2 16:44:05
- 什么是運算放大器失調(diào)電流2025/9/1 17:01:22
- 高速PCB信號完整性(SI)設(shè)計核心實操規(guī)范
- 鎖相環(huán)(PLL)中的環(huán)路濾波器:參數(shù)計算與穩(wěn)定性分析
- MOSFET反向恢復(fù)特性對系統(tǒng)的影響
- 電源IC在惡劣環(huán)境中的防護設(shè)計
- 連接器耐腐蝕性能測試方法
- PCB電磁兼容(EMC)設(shè)計與干擾抑制核心實操規(guī)范
- 用于相位噪聲測量的低通濾波器設(shè)計與本振凈化技術(shù)
- MOSFET在高頻開關(guān)中的EMI問題
- 電源IC在便攜式設(shè)備中的設(shè)計要點
- 連接器結(jié)構(gòu)設(shè)計常見問題分析









