- 智能語音處理
- 張雄偉 孫蒙 楊吉斌
- 916字
- 2020-11-05 10:07:07
2.2.2 稀疏表示
信號可稀疏化是利用稀疏性進行信息處理的前提。因此,尋找普適的信號稀疏化方法和特定信號的稀疏模型成為一個重要的研究方向,統(tǒng)稱為稀疏表示。
稀疏表示最早可追溯到19世紀傅里葉分析方法的產(chǎn)生。傅里葉提出,任意周期函數(shù)都可用三角基的疊加來表示。這種利用基函數(shù)描述信號的思想,對近代數(shù)學以及物理、工程技術(shù)都產(chǎn)生了深遠的影響。三角基是一種正交基,采用包含三角基等正交基描述信號的方法得到了廣泛的應用。對一些信號采用正交基進行分解后,變換系數(shù)呈現(xiàn)出極大的稀疏特性。這一性質(zhì)引起了研究者的興趣。例如,利用傅里葉變換,可以得到正弦信號的頻域稀疏表示,這在通信信號、音樂分析等處理中極為有用。頻域分析已成為信號處理的基本方法。其他變換,如Hadamard變換、離散余弦變換(DCT)、Karhunen-Loeve變換(KLT)等也廣泛應用在圖像處理等領(lǐng)域。
圖2-4給出了稀疏表示理論發(fā)展的大致過程。
傳統(tǒng)的稀疏表示基于正交線性變換,但許多信號是自然現(xiàn)象的混合體,復雜成分在單一的正交變換中不能非常有效地表現(xiàn)。在聲音和圖像處理方面,典型的信號描述方式是以短時傅里葉變換(STFT)、離散余弦變換(DCT)為代表的非冗余正交變換。STFT處理的所有波形都具有正比于處理窗長的固定尺度參數(shù),因而無法描述非平穩(wěn)信號;DCT的基函數(shù)缺乏時/空分辨率,無法有效提取具有局部性質(zhì)的信號特征。20世紀80年代中期,以小波理論為代表[5]的多尺度分析為信號描述指引了新方向。區(qū)別于STFT,小波變換是一種變分辨率的時頻聯(lián)合分析方法:當分析低頻信號時,其時間窗增大,而當分析高頻信號時,其時間窗減小。這正好符合實際中高頻信號時域較短、低頻信號持續(xù)時間長的自然規(guī)律。然而,該理論對于邊緣不連續(xù)的圖像信號效果不理想[6]。為解決這個問題,文獻[1]基于多尺度的小波分析方法構(gòu)造了一個函數(shù)系統(tǒng)。這個系統(tǒng)不同于傳統(tǒng)的正交基,它采用了更多的非正交函數(shù)來表示不同尺度的信號成分。由于這個函數(shù)系統(tǒng)中的函數(shù)數(shù)量多于正交基數(shù)量,因此被稱為冗余(過完備)字典。1996年,B.A. Olshausen和D.J. Field對冗余字典進行了系統(tǒng)的闡述,并論證了過完備表示更符合哺乳動物視覺系統(tǒng)的生理學特性[7]。冗余字典理論的提出引起了廣泛關(guān)注和研究,通過構(gòu)造冗余字典來獲取稀疏表示已成為一種通用的方法。