- 數(shù)字多媒體廣播
- 李棟編著
- 2005字
- 2018-12-27 19:01:26
2.10 高效音頻編碼與頻帶恢復(fù)(SBR)技術(shù)
2.10.1 AAC-Plus V1 與AAC-Plus V2
最有效的一種音頻壓縮方法是AAC,已經(jīng)于1997年在MPEG2中標(biāo)準(zhǔn)化。AAC是一種變換編碼,在這種編碼方法中有意識(shí)放棄了與過(guò)去的一些編碼方法例如Layer-2和MP3的向下兼容性,因此可以避免以此為條件的限制。
AAC在數(shù)據(jù)率遠(yuǎn)低于96kb/s的情況下可以達(dá)到很好的立體聲音頻質(zhì)量,然而這對(duì)許多應(yīng)用來(lái)說(shuō)總還是顯得大多。每個(gè)比特的傳輸與存儲(chǔ)都要付出代價(jià)。
在數(shù)字廣播中,音頻比特率的減半意味著可提供的節(jié)目套數(shù)加倍。
如果將比特率降低到一個(gè)臨界值以下,就會(huì)以不同的形式損傷音頻質(zhì)量:音頻帶寬必須限制,這會(huì)使信號(hào)聽(tīng)起來(lái)發(fā)悶;或者立體聲聲基受損,使信號(hào)聽(tīng)起來(lái)幾乎是單聲道的而沒(méi)有空間的感覺(jué)。在最壞的情況下甚至可聽(tīng)出有干擾的編碼不自然產(chǎn)物。
過(guò)去,人們已經(jīng)清楚認(rèn)識(shí)了傳統(tǒng)的變換編碼的極限。為了改善它的能力必須開(kāi)發(fā)新的方法與改進(jìn)現(xiàn)有的方法。先進(jìn)音頻編碼方法AAC與頻帶恢復(fù)(SBR)技術(shù)、參數(shù)立體聲相結(jié)合,產(chǎn)生出新的高效編碼方法。
MPEG-4 AAC-Plus音頻編碼系列是由三個(gè)MPEG技術(shù)結(jié)合起來(lái)的:AAC用作核心編碼器,頻帶恢復(fù)(SBR)與參數(shù)立體聲(PS)兩種附加技術(shù)使極大提高編碼效率成為可能。SBR是Coding Technologies發(fā)明的,利用它可以恢復(fù)音頻信號(hào)的上部范圍的頻譜,直到15kHz。
SBR與核心編碼AAC相結(jié)合不僅可以在MPEG-2,也可以在MPEG-4,而且在高效的AAC型,被標(biāo)準(zhǔn)化及命名為AAC-Plus V1。
SBR也可以與基本的語(yǔ)音編碼方法(如碼本激勵(lì)線性預(yù)測(cè)-CELP、諧波矢量激勵(lì)編碼-HVXC)相結(jié)合,用來(lái)展寬語(yǔ)言頻帶,提高語(yǔ)言節(jié)目的清晰度與可懂度。
參數(shù)立體聲技術(shù)是在很低的比特率的情況下,使一個(gè)音頻信號(hào)的立體聲信息的形成成為可能,同時(shí)在解碼器中重建立體聲聲像。這項(xiàng)技術(shù)也是MPEG-4標(biāo)準(zhǔn)的組成部分。
AAC、SBR與SP這三種技術(shù)的結(jié)合稱為AAC-Plus V2,是目前現(xiàn)有音頻編碼方法中最有效的音頻編碼方法。AAC-Plus兩個(gè)版本的關(guān)系如圖2-10-1所示。

圖2-10-1 AAC-Plus的兩個(gè)版本
2.10.2 SBR基本原理與壓縮效率
SBR技術(shù)在編碼器端通過(guò)音頻信號(hào)產(chǎn)生出重要的信息。在解碼器端,這個(gè)信息用作以盡可能高的準(zhǔn)確度實(shí)現(xiàn)音頻信號(hào)上部頻譜部分的重建。
在編碼器輸入端提供沒(méi)有編碼的音頻信號(hào),AAC-Plus編碼器用一個(gè)正交鏡像濾波器(QMF)組分析完整的信號(hào)頻譜。這種分析產(chǎn)生出一個(gè)頻譜包絡(luò)特性的描述。這個(gè)描述作為AAC-Plus解碼器的SBR控制信息,補(bǔ)入到比特流中。最終傳給解碼器的數(shù)據(jù)流中包括音頻信號(hào)下部頻譜部分編碼的AAC音頻數(shù)據(jù)與SBR控制信息。
控制信息的數(shù)據(jù)率取決于音頻信號(hào),一般來(lái)說(shuō)每個(gè)聲道大約1~3kb/s,這要比對(duì)上部頻譜部分進(jìn)行正常的編碼產(chǎn)生的比特率低的多。因此,AAC-Plus V1 在56kb/s的數(shù)據(jù)率下所能達(dá)到的音頻質(zhì)量,可與單獨(dú)使用AAC編碼器數(shù)據(jù)率為96kb/s時(shí)的質(zhì)量相比美。如圖2-10-2所示是SBR原理示意圖。

圖2-10-2 SBR原理示意圖
AAC-Plus在所謂的雙碼率工作下提供最大可能的效率:AAC-Plus編碼器的AAC部分以原始音頻信號(hào)的半取樣頻率工作,而SBR以原始的取樣頻率處理音頻信號(hào)。由此可產(chǎn)生的結(jié)果是,一方面AAC僅僅是對(duì)音頻信號(hào)的下部頻譜部分編碼,另一方面通過(guò)音頻信號(hào)在由時(shí)域向頻域變換時(shí)的高的頻率分辨率,提高了編碼效率。
此外,這個(gè)優(yōu)點(diǎn)對(duì)算法的復(fù)雜性產(chǎn)生影響。少的音頻樣值意味著低的運(yùn)算能力和與此相聯(lián)系的電流消耗。這主要對(duì)于在移動(dòng)電話或其他便攜終端設(shè)備中的處理器,如音樂(lè)播放器有重要意義。
SBR的作用在編碼端像一個(gè)預(yù)處理器,而在解碼端像一個(gè)后處理器,如圖2-10-3所示。如圖2-10-4所示是AAC與SBR相結(jié)合,即AAC-Plus的編碼器,圖2-10-5是相應(yīng)的解碼器原理方框圖。

圖2-10-3 SBR預(yù)處理與后處理原理方框圖

圖2-10-4 AAC-Plus的編碼器原理方框圖

圖2-10-5 AAC-Plus的解碼器原理方框圖
2.10.3 參數(shù)立體聲原理與效果
參數(shù)立體聲技術(shù)按照相似的原理工作。在參數(shù)立體聲工作方式中,立體聲信息有效獲得是基于在編碼時(shí)不再需要兩個(gè)明顯分離的音頻聲道,而是可以從兩個(gè)聲道產(chǎn)生一個(gè)單聲道信號(hào)。這個(gè)單聲道信號(hào)在相同的聲音質(zhì)量下,僅需要原始立體聲信號(hào)大約一半的比特率。圖2-10-6示出參數(shù)立體聲的工作原理。

圖2-10-6 參數(shù)立體聲工作原理
編碼器的輸入信號(hào)是原始立體聲信號(hào),首先對(duì)兩個(gè)聲道進(jìn)行分析。分析的結(jié)果是立體聲信號(hào)的參數(shù)信息,例如全景信息、空間聲或相位差。這些參數(shù)信息作為控制信息,如同SBR一樣,補(bǔ)入到比特流中。在它的解碼器的基礎(chǔ)上重建立體聲聲像,與在一個(gè)立體聲信號(hào)兩個(gè)聲道編碼時(shí)相比,需要的數(shù)據(jù)率明顯減小。參數(shù)信息典型的數(shù)據(jù)率可以處于2~2.5kb/s。
AAC-Plus-V2編碼器包含了三種技術(shù)(AAC、SBR和PS),在大約32kb/s時(shí)達(dá)到的音頻質(zhì)量,與單獨(dú)使用AAC時(shí)96kb/s比特率的質(zhì)量相當(dāng)。
2.10.4 應(yīng)用領(lǐng)域
作為最有效的音頻編碼方法MPEG-4 AAC-Plus已經(jīng)在許多領(lǐng)域得到應(yīng)用。AAC-Plus-V2不久前已經(jīng)是第三代移動(dòng)通信的3GPP規(guī)范的組成部分。AAC-Plus-V1 已經(jīng)有成效地用于在移動(dòng)電話上的音樂(lè)下載,如在日本、韓國(guó)、德國(guó)和英國(guó)應(yīng)用。在數(shù)字廣播中編解碼器是用來(lái)保證聲音質(zhì)量的,例如應(yīng)用在美國(guó)的XM衛(wèi)星廣播和在數(shù)字長(zhǎng)中短波廣播(DRM)中。
AAC-Plus也是DVB-H標(biāo)準(zhǔn)的組成部分,是基于IP為未來(lái)的移動(dòng)DVB手機(jī)傳送廣播和電視節(jié)目。
此外,在互聯(lián)網(wǎng)中也有越來(lái)越大的意義:越來(lái)越多的電臺(tái)使用AAC-Plus,使用明顯低的比特率就可以獲得相同的音頻質(zhì)量。
MPEG-4 AAC-Plus以它的可通用性,為實(shí)現(xiàn)廣播、通信、互聯(lián)網(wǎng)和娛樂(lè)電子之間的融合奠定基礎(chǔ)。
- 寬帶接入技術(shù)
- 元器件易學(xué)通:常用器件分冊(cè)
- 5G無(wú)線接入網(wǎng)架構(gòu)及關(guān)鍵技術(shù)
- 邊緣計(jì)算技術(shù)與應(yīng)用
- 密碼之謎
- 室內(nèi)分布系統(tǒng)規(guī)劃與設(shè)計(jì):GSM/TD-SCDMA/TD-LTE/WLAN
- 無(wú)線網(wǎng)絡(luò)優(yōu)化分析
- 從算法到電路:數(shù)字芯片算法的電路實(shí)現(xiàn)
- 信息理論與編碼
- 拯救iphone之電路與故障檢修
- 5G賦能智能制造
- LTE/LTE-Advanced系統(tǒng)架構(gòu)和關(guān)鍵技術(shù)
- 認(rèn)識(shí)5G+
- H3CNE實(shí)驗(yàn)手冊(cè)
- 微信小程序開(kāi)發(fā)圖解案例教程(附精講視頻)(第2版)