官术网_书友最值得收藏!

3.4.1 基本模型

從一般意義上考慮,當存在一組觀測數據Y=[y1y2,…,yn,…,yN],其中yn∈?D是一個觀測向量,X=[x1x2,…,xn,…,xN]表示Y對應的一組隱變量,其中xn∈?qqD)是與yn∈?D對應的隱變量時,可以利用概率框架為兩者建立一種從隱變量空間到觀測空間的映射,表示為[6]

yn=gxnW)+ηny

(3-20)

其中,W是映射函數g的一組參數,ηny∈?D代表噪聲,并假設其服從均值為零的高斯分布,β-1為噪聲方差。這種模型稱為一般意義上的隱變量模型。

由于qD,隱變量的維度小于觀測向量,因此可以利用隱變量模型進行數據降維。它能夠過濾樣本間誤差及個體差異,被廣泛應用于模式識別、機器學習等領域[4]

在具體應用時,為便于計算,可以考慮利用一組基函數的線性組合來表示函數g

其中,?i為一組基函數,W=[w1w2,…]是基函數的投影矩陣,wi∈?D

對于式(3-21),假設W的每一個行向量都服從高斯分布,,即從所有的隱變量到觀測變量的每一維建立映射時,給每個映射都賦予一個高斯過程先驗,則觀測數據Yd行向量Yd,:的似然函數可以表示為[7]

其中,KY為核矩陣,Θ是與KY相關的參數集,KY中的元素由核函數(KYij=kxixj)定義,其計算公式為

其中,δxx為Kronecker δ函數,即x=x′時,δ的值為1,xx′時,δ的值為0。

從式(3-23)可以看出,基函數的選擇與核函數形式密切相關,例如,當基函數選擇為線性時,即?ix)=x,核函數的形式變為

kxx′)=xTx′+β-1δxx

(3-24)

還可以通過選擇合適的基函數,使核函數變為徑向基函數(Radial Basis Function,RBF)形式:

其中,θ1θ2β1β2是RBF中的參數。

隱變量模型有一個很重要的性質是條件獨立,即在給定隱變量的時候,觀測變量的各維之間是獨立的,因此觀測數據的似然概率可以表示為各維似然概率的乘積[7]

以上建立的隱變量模型由于從低維的隱空間到高維的觀測空間的映射是一個高斯過程,因此稱為高斯過程隱變量模型(GPLVM)[8]。GPLVM的一個顯著特征就是利用核函數可以把線性降維拓展到非線性,因此模型精度更高,而且可以處理小樣本的高維數據。

主站蜘蛛池模板: 宁城县| 鹤峰县| 开平市| 运城市| 高尔夫| 波密县| 阳山县| 和龙市| 金寨县| 阿荣旗| 尉犁县| 鲁山县| 隆安县| 乐业县| 富阳市| 洪泽县| 新龙县| 五家渠市| 穆棱市| 磐安县| 溧水县| 弋阳县| 南部县| 潼关县| 临夏市| 西林县| 张家界市| 宜丰县| 乌审旗| 乃东县| 沧州市| 盐津县| 阳西县| 仙桃市| 嘉祥县| 苏州市| 三台县| 绥中县| 桑日县| 巴彦淖尔市| 兰溪市|