官术网_书友最值得收藏!

1.6 多元正態分布

正如我們在1.3小節里提及的,多元統計分析屬于推論統計的一部分,也需要通過樣本統計量的分布來估計、推測總體參數并進行假設檢驗。因此在本書中,定義多元變量為隨機變量,它們具有隨機變量的一切性質,并且不同特點的多元變量有著不同的分布規律,例如多元正態分布、多元t分布、多元Gamma分布等;其中應用最廣泛、最重要的分布是多元正態分布,它是眾多多元分布的基礎。本書后面用到的很多檢驗統計量,它們的分布都與多元正態分布有關。

先回憶一元正態分布的定義,如果連續型隨機變量X的概率密度函數為

則稱X服從期望為μ、方差為σ2的正態分布,一般記為X~N(μ,σ2)。

正態分布是一族分布(圖1.5),其概率密度函數的曲線隨著期望與方差的不同而不同。如果將隨機變量X標準化為變量Z,則變量Z服從期望為0,標準差為1的標準正態分布,記為Z~N(0,1)。

圖1.5 期望與方差不同的正態分布

如果有兩個連續型隨機變量X和Y服從二元正態分布,它們的聯合概率密度函數為

式中

μX與μY分別表示變量X和Y的期望值,σX與σY分別表示變量X和Y的標準差,ρXY表示變量X和Y的相關系數。

圖1.6(a)為變量X和Y的相關系數設為0.5條件下,聯合概率密度函數z=f(x,y)的三維圖。圖1.6(b)為圖1.6(a)的俯視圖,每個橢圓曲線上的概率密度相等。當變量X和Y相互獨立(相關系數為0)時,等概率密度曲線為正圓曲線;當變量X和Y完全相關(相關系數為1)時,等概率密度曲線退化為一條直線(圖1.6(b)中的虛線)。二元正態分布是二元聯合概率分布中最重要的分布。

圖1.6 二元正態分布

如果p維隨機變量X=(X1,X2,……,XpT服從p元正態分布,則聯合概率密度函數為

一般記為Np(μ,Σ),其中μ=(μ1,μ2,……,μpT為p個變量的期望值向量,Σ表示p個隨機變量的協方差矩陣,且是p×p階正定對稱矩陣,Σ-1,|Σ|分別為Σ的逆矩陣與行列式值。

根據上面定義的多元正態分布密度函數,在一定的條件下我們可以求出各個部分變量的邊緣分布、多元變量的樣本平均值分布或者樣本協方差的分布等。

在許多關于多元統計分析的經典書籍里,上述的內容往往置于書本的第1章,因為這些知識是推導多元統計方法的基礎。但考慮到本書的使用對象主要是心理學、教育學等社會科學領域的學生或工作者,學習目的主要是為了正確應用多元統計方法。我們認為掌握了最基本的概念之后直接學習分析方法是可行的,相關的概率與統計理論知識可以在達到更高水平以后再繼續領會。因此本書中有關多元分布的知識不再展開,有需要的讀者可以參考相關的書籍(Anderson,2003)。

主站蜘蛛池模板: 敦煌市| 大新县| 任丘市| 方正县| 敖汉旗| 清水县| 莱州市| 桑日县| 永州市| 康平县| 陕西省| 化州市| 勃利县| 怀集县| 田阳县| 隆林| 茂名市| 志丹县| 漾濞| 光泽县| 登封市| 都匀市| 冀州市| 湛江市| 桑植县| 女性| 永康市| 江永县| 义乌市| 海南省| 炎陵县| 永胜县| 永顺县| 靖宇县| 延吉市| 调兵山市| 绥化市| 酉阳| 广宁县| 鹤岗市| 绥江县|