官术网_书友最值得收藏!

2.9 CELP與HVXC語音編碼方法

2.9.1 碼本激勵線性預測(CELP)編碼

CELP是性能很好的語音編碼算法。它用線性預測提取聲道參數(shù),用一個包含許多典型的激勵矢量的碼本作為激勵參數(shù),每次編碼時都在這個碼本中搜索一個最佳的激勵矢量。CELP已經(jīng)被許多語音編碼標準所采用。除了高質(zhì)量的通信系統(tǒng)外,CELP也在數(shù)字中短波廣播(DRM)中得到應用。

CELP是一種混合編碼方法,它將信號波形編碼與參數(shù)編碼的優(yōu)點結(jié)合起來。結(jié)果是有好的語音質(zhì)量,在4~16kb/s低的數(shù)據(jù)率下有PCM相應的質(zhì)量。大部分混合編碼方法的原理是線性預測編碼(LPC)。它的保留的剩余信號通過在一個表中“查閱”而被壓縮。通常,40個樣值(5ms信號)通過10比特(有1024項的表)來反映。CELP的主要部分,一個大約50ms的信號延時,低延時的CELP被降到2ms以下。

MPEG-4-CELP模塊使用8kHz(窄帶)或16kHz(寬帶)取樣頻率,語言信號的編碼數(shù)據(jù)率范圍分別為3.85~12.2kb/s或10.9~23.8kb/s。可以以200b/s的步級來分級。在這些數(shù)據(jù)率下,音樂只能降低質(zhì)量傳輸。

帶寬的可分級性在采樣率為8kHz和16kHz時均可實現(xiàn),是通過在CELP編碼上加一個帶寬擴展工具來實現(xiàn)的。

如圖2-9-1所示是MPEG-4-CELP解碼器方框圖。

圖2-9-1 MPEG-4-CELP解碼器電路方框圖

語言信號的頻譜包絡,即共振峰的跳變,借助LPC(線性預測編碼)參數(shù)描述,表示為“線性頻譜頻率”(LSF)并使用一個矢量量化器(VQ)編碼。LP綜合濾波器的激勵信號可以是“多脈沖激勵”(MPE)或“規(guī)則脈沖激勵”(RPE)。MPE方式可以在兩種取樣頻率下應用,而RPE方式只能在16kHz的取樣頻率下應用,但其編碼器的復雜性明顯要比MPE方式低,但為此不得不付出編碼效率受到限制的代價。在這兩種激勵方式下,發(fā)聲的信號片段的周期性借助一個自適應碼本加以充分利用。需要注意的是,圖2-9-1中的最后方塊所示的濾波器是可選擇的,而沒有被標準的規(guī)范部分所規(guī)定。

與其他標準化的語言編碼器相比較,MPEG-4-CRLP的突出特征是有相當高的靈活性。它對窄帶和寬帶語言信號(16kHz取樣率)都可以編碼。此外,所希望的數(shù)據(jù)率可以根據(jù)取樣率、激勵方式和幀長,以大約0.2kb/s到0.8kb/s的步級進行選擇。這里,應用的幀長的范圍是10~40ms。這樣,算法系統(tǒng)的時延在15ms以下是可能的。

除了它的靈活性外,MPEG-4-CELP附加一種數(shù)據(jù)率可分級性,也稱之為“嵌入編碼”。此時,編碼器產(chǎn)生一個所謂的基本比特流(基本層)和一個或多個擴展比特流(增強層)。根據(jù)可提供的傳輸容量,除了基本數(shù)據(jù)流外,解碼器也可以對一個或多個擴展比特流計值,以改善解碼信號的質(zhì)量。如圖2-9-2所示是具有可分級數(shù)據(jù)率的MPEG-4-CELP編碼的一個例子。除了激勵信號的改良外,使用擴展比特流也使帶寬可分級成為可能。

圖2-9-2 具有可分級數(shù)據(jù)率的MPEG-4-CELP

在許多語言編碼標準中,編碼和解碼比特被準確地定義,在MPEG-4標準的規(guī)范部分中僅規(guī)定了比特流格式和解碼方法。然而,編碼只在標準的信息部分借助一種編碼器例子加以說明。據(jù)此有可能在標準通過以后,編碼效率通過編碼器的優(yōu)化而進一步改善。此外,這樣做對于當時的應用來說,可以選擇編碼器復雜性和編碼效率之間的最佳關(guān)系。

2.9.2 諧波矢量激勵編碼(HVXC)

為了對典型的2kb/s這種很低數(shù)據(jù)率的語言信號進行編碼,在MPEG-4中應用了一種參數(shù)語言編碼器,稱為諧波矢量激勵編碼(Harmonic Vector eXcitation Coding,HVXC)。

HVXC允許對語言信號在2kb/s和4Kbs之間進行可分級性編碼。HVXC提供了在延遲模式上的可分級性。其編碼器和解碼器可以獨立地選擇低或正常的延遲模式。如圖2-9-3所示是MPEG-4-HVXC解碼器方塊電路圖。

圖2-9-3 MPEG-4-HVXC解碼器方塊電路圖

HVXC的解碼過程分四步進行:參數(shù)的反量化;對聲音幀用正弦合成產(chǎn)生激勵信號和加上噪聲分量;對非聲音幀通過查找碼書產(chǎn)生激勵信號;LPC(線型預測編碼)合成。對合成語言質(zhì)量的增強可以使用頻譜后置濾波。

當語言信號的頻譜包絡與在MPEG-4-CELP編碼時相似時,激勵信號的編碼可以使用兩種不同的技術(shù)。對于無聲信號片段來說,激勵信號與在CELP時相似,通過一個碼本索引和通過幅度信息描述。相反,在發(fā)聲信號片段應用了諧波綜合,它是將基音和諧音的正弦振蕩按照傳輸?shù)幕l進行綜合。在此應用了一種有效的算法,它使用了快速傅里葉變換(FFT),同時確保了在相連續(xù)的幀中相連續(xù)的相位變化和頻率變化。

HVXC的幀長為20ms,這樣,算法系統(tǒng)延時可以達到33.5ms。如同在MPEG-4-CELPP已經(jīng)指出的,圖2-9-3中最后的濾波器是可供選擇的,并不是標準的規(guī)范部分所規(guī)定的。HVXC也提供數(shù)據(jù)率的可分級性,除了2kb/s的基本比特流外,可以傳輸2kb/s的擴展比特流。一種4kb/s的固定數(shù)據(jù)率也是可能的。

基于在HVXC中應用的參數(shù)表示,在解碼器按照簡單的方式獨立地變化語言信號的音高和重放速度是可能的。這種附加的功能不需要特殊的編碼,而HVXC解碼器復雜性的提高是微不足道的。在MPEG-4 驗證試驗時表明,HVXC在2kb/s和4kb/s時的質(zhì)量,顯著好于CELP在4.8kb/s時的質(zhì)量。

HVXC編碼方法數(shù)字中短波廣播中播送語言節(jié)目時使用,每套節(jié)目2kb/s就足夠了,一部DRM發(fā)射機,可同時傳輸四套這樣的節(jié)目。

主站蜘蛛池模板: 司法| 攀枝花市| 太和县| 常德市| 珠海市| 吉林省| 西乌珠穆沁旗| 台山市| 德州市| 平舆县| 许昌市| 石台县| 阿拉善盟| 翁牛特旗| 孟村| 仙桃市| 缙云县| 乐都县| 上饶县| 长宁县| 黔江区| 阳曲县| 石渠县| 龙泉市| 武城县| 香格里拉县| 永丰县| 南木林县| 溧水县| 浠水县| 枣阳市| 郓城县| 云龙县| 涿鹿县| 双鸭山市| 绥宁县| 白玉县| 阿坝县| 吉木萨尔县| 莆田市| 庆元县|