- 智能語音處理
- 張雄偉 孫蒙 楊吉斌
- 858字
- 2020-11-05 10:07:13
3.4.1 基本模型
從一般意義上考慮,當存在一組觀測數據Y=[y1,y2,…,yn,…,yN],其中yn∈?D是一個觀測向量,X=[x1,x2,…,xn,…,xN]表示Y對應的一組隱變量,其中xn∈?q(q≤D)是與yn∈?D對應的隱變量時,可以利用概率框架為兩者建立一種從隱變量空間到觀測空間的映射,表示為[6]:
yn=g(xn;W)+ηn,y
(3-20)
其中,W是映射函數g的一組參數,ηn,y∈?D代表噪聲,并假設其服從均值為零的高斯分布,,β-1為噪聲方差。這種模型稱為一般意義上的隱變量模型。
由于q≤D,隱變量的維度小于觀測向量,因此可以利用隱變量模型進行數據降維。它能夠過濾樣本間誤差及個體差異,被廣泛應用于模式識別、機器學習等領域[4]。
在具體應用時,為便于計算,可以考慮利用一組基函數的線性組合來表示函數g:
其中,?i為一組基函數,W=[w1,w2,…]是基函數的投影矩陣,wi∈?D。
對于式(3-21),假設W的每一個行向量都服從高斯分布,,即從所有的隱變量到觀測變量的每一維建立映射時,給每個映射都賦予一個高斯過程先驗,則觀測數據Y第d行向量Yd,:的似然函數可以表示為[7]
其中,KY為核矩陣,Θ是與KY相關的參數集,KY中的元素由核函數(KY)i,j=k(xi,xj)定義,其計算公式為
其中,δx,x′為Kronecker δ函數,即x=x′時,δ的值為1,x≠x′時,δ的值為0。
從式(3-23)可以看出,基函數的選擇與核函數形式密切相關,例如,當基函數選擇為線性時,即?i(x)=x,核函數的形式變為
k(x,x′)=xTx′+β-1δx,x′
(3-24)
還可以通過選擇合適的基函數,使核函數變為徑向基函數(Radial Basis Function,RBF)形式:
其中,θ1,θ2,β1和β2是RBF中的參數。
隱變量模型有一個很重要的性質是條件獨立,即在給定隱變量的時候,觀測變量的各維之間是獨立的,因此觀測數據的似然概率可以表示為各維似然概率的乘積[7]:
以上建立的隱變量模型由于從低維的隱空間到高維的觀測空間的映射是一個高斯過程,因此稱為高斯過程隱變量模型(GPLVM)[8]。GPLVM的一個顯著特征就是利用核函數可以把線性降維拓展到非線性,因此模型精度更高,而且可以處理小樣本的高維數據。