- 智能語音處理
- 張雄偉 孫蒙 楊吉斌
- 840字
- 2020-11-05 10:07:06
2.1 引言
隨著信息技術的快速發展,獲取信息越來越方便,獲得的信息也越來越多。例如,在日常生活中,人們可以方便地用智能手機拍照、錄音,如果手機容量不夠大,手機的存儲空間可能很快就會用完;在工業和軍事上,高分辨雷達遙感成像、大規模傳感器網絡、高頻寬帶通信等會產生或傳輸大量的信息;人工智能新技術的應用更是需要大量的數據做支撐。因此,海量信息的傳輸和存儲是很多領域迫切需要解決的問題。
一般而言,從自然界感知或獲取的數據都需要進行模/數轉換變為數字信號。根據Nyquist采樣定理,采樣頻率需要高于信號帶寬的2倍才能不失真地恢復原始信號,這樣得到的數據存在大量的冗余信息。傳統的方法是通過壓縮編碼去除冗余信息,有效降低數據量。之所以能夠進行有效壓縮,其中一個重要的原因是實際信號中可能只有很少的非零成分,大部分分量都為零或者接近零。信號的這種特性稱為稀疏性(sparsity)。
圖2-1顯示的一段聲音信號記錄了一個短時間的撞擊聲。從圖中可以看出,除短時間信號幅度較大外,其他大部分時間信號幅度都非常小,因此稱這段信號具有稀疏性。
如果一個信號具有稀疏性,就可以稱這個信號是稀疏的。為了利用信號的稀疏性,需要找到信號合適的稀疏表示(Sparse Representation,SR),即采用某種特定的表示時,信號具有稀疏性。這種稀疏表示模型的核心思想[1]自1993年被明確提出后,就受到了廣泛的關注,研究成果不斷涌現。
從信號采樣的角度來分析,如果能直接找到信號的稀疏表示,并對其進行適當的觀測,就能達到直接從信號獲取信息的目的,從而避免對冗余信息的存儲和處理。這成為尋找新的采樣理論的出發點。壓縮感知(Compressed Sensing/Compressive Sampling,CS)理論[2]指出:對于存在稀疏表示的信號,可以利用一個與變換基不相干的觀測矩陣對信號進行投影得到低維觀測值。這個理論突破了Nyquist定理的限制,在實際系統構建中展現出了極大的優勢,并為處理高維信號提供了新的思路。
本章圍繞稀疏和壓縮感知的核心處理方法,對稀疏的概念和表示方法以及壓縮感知的原理和壓縮感知域信號的處理方法等展開介紹。