官术网_书友最值得收藏!

§3 矩、協方差和相關系數

一、矩

矩是隨機變量重要的數字特征之一,前面討論的數學期望和方差都是矩的特例。在數理統計中,將會看到矩的應用。

定義3.1 設X為一隨機變量,若EXk)(k=1,2,…)存在,稱它為Xk階原點矩,記為αk(簡稱k階矩),即αk=EXk)(k=1,2,…)。

顯然,X的數學期望就是X的一階原點矩。

定義3.2 設X為一隨機變量,若

μk=EX-EX)]k (k=1,2,…)

存在,則稱μkXk階中心矩。

顯然,X的方差就是X的二階中心矩。

定義3.3 設X為一隨機變量,若μkk=1,2,3,4)存在,

稱為隨機變量X的偏度系數(skewness),記為γX),即

稱為隨機變量X的峰度系數(kurtosis),記為κX),即

γX)與κX)均為無量綱的量。偏度系數γX)度量了隨機變量X的分布關于其均值EX)的不對稱程度;峰度系數κX)度量了隨機變量X的分布與正態分布相比較的平坦程度。不難求得,對于正態隨機變量X,有γX)=0,κX)=0。

二、協方差與相關系數

對于二維隨機變量(XY),除了討論XY的數學期望和方差外,還需要討論描述XY之間相互關系的數字特征。

在證明方差性質(3)中,如果兩個隨機變量XY相互獨立時,則有

E{[X-EX)][Y-EY)]}=0

反之,若E{[X-EX)][Y-EY)]}≠0,則XY不相互獨立,這意味著XY之間存在著一定的關系。

定義3.4 設(XY)為二維隨機變量,若E{[X-EX)][Y-EY)]}存在,則稱它為XY協方差,記為Cov(XY),即

Cov(XY)=E{[X-EX)][Y-EY)]}

而   

稱為隨機變量XY相關系數

ρXY是一個無量綱的量,通常簡記為ρ

對協方差我們有下列兩個常用公式

var(X+Y)=var(X)+var(Y)+2Cov(XY)  (3.1)

Cov(XY)=EXY)-EXEY)  (3.2)

協方差具有下列性質:

(1)Cov(XY)=Cov(YX);

(2)Cov(aXbY)=abCov(XY) (ab為常數);

(3)Cov(X1+X2Y)=Cov(X1Y)+Cov(X2Y)。

下面推導ρXY的兩條重要性質,并說明ρXY的意義。

(1)|ρXY|≤1;

(2)若XY相互獨立,則ρXY=0;

(3)|ρXY|=1的充分必要條件是XY依概率1線性相關,即存在兩個常數ab,且b≠0,使P{Y=bX+a}=1。

 (1)

即得-1≤ρXY)≤1,所以|ρXY)|≤1。

(2)當XY相互獨立時,Cov(XY)=0,則ρXY=0。

(3)如證(3)先分析均方誤差

e=EY-(bX+a)]2=EY2)+b2EX2)+a2-2bEXY)+2abEX)-2aEY)  (3.3)

若|ρXY|=1,欲證存在ab使成立P{Y=aX+b}=1,先選擇ab使e取到最小。由

解得駐點   

a0b0代入式(3.3)得

由假設ρXY=1知

E{[Y-(a0+b0X)]2}=0

由方差的計算公式(2.4),得

因此有  var[Y-(a0+b0X)]=0

EY-(a0+b0X)]=0

由方差的性質(4)可知:P{Y-(a0+b0X)=0}=1,即

P{Y=a0+b0X}=1

反之,若存在a*和b*使

P{Y=a*+b*X}=1

也即  P{Y-(a*+b*X)=0}=1

那么  P{[Y-(a*+b*X)]2=0}=1

由方差性質(4)可知(其中C=0)

E{[Y-(a*+b*X)]2}=0

于是

則得  |ρXY|=1

從以上的討論中可以看出,當|ρXY|較大時e較小,表明XY線性關系較密切,特別當|ρXY|=1時,XY之間以概率1存在著線性關系。于是ρXY是一個可以用來描述XY之間線性關系密切程度的量。換而言之,當|ρXY|較大時,通常說XY線性相關的程度較好;當|ρXY|較小時,反映XY線性相關的程度較差。特別當ρXY=0時,稱XY不相關

應當指出,在ρXY存在的條件下,若XY相互獨立,則XY必不相關,因為此時Cov(XY)=0,ρXY=0;但是XY不相關,XY卻不一定相互獨立,這是因為隨機變量XY不存在線性關系,并不說明XY不存在其他關系。

【例1】 設二維隨機變量(XY)的概率密度為

試驗證XY不相關,但XY不是相互獨立的。

 由圖3-3知除在閉單位圓上,其他處fxy)≡0,那么

圖3-3

同理   

同理  EY)=0

另外  

所以  Cov(XY)=EXY)-EXEY)=0

即  ρXY=0

這說明隨機變量XY不相關,顯然fxy)≠fXxfYy),這說明XY不相互獨立。

但是當(XY)服從二維正態分布時,XY相互獨立與XY互不相關是等價的。

【例2】 設(XY)服從二維正態分布,它的分布密度為

ρXY)。

 由第二章§3例6知(XY)的邊緣概率密度為

故得EX)=μ1EY)=μ2。另外

,則有

則   

這個事實說明,若XY相互獨立,XY必不相關;反之亦然,即若XY不相關時,那么ρ=ρXY=0,此時成立算式fxy)=fXxfYy),故知對于二維正態隨機變量(XY)來說,XY不相關與XY相互獨立是等價的。

【例3】 設(XY)具有概率密度,求Cov(XY)。

 由于Cov(XY)=EXY)-EXEY

   又   

   而       (見圖3-4)

圖3-4

所以  

所以

則  Cov(XY)=0

【例4】 已知三個隨機變量XYZ中,EX)=EY)=1,EZ)=-1,var(X)=var(Y)=var(Z)=1,ρXY=0,,求EX+Y+Z),var(X+Y+Z)。

 EX+Y+Z)=EX)+EY)+EZ)=1+1-1=1

又   

則  var(X+Y+Z)=3

主站蜘蛛池模板: 洪江市| 揭阳市| 清原| 安义县| 丹东市| 浦江县| 昭苏县| 中牟县| 东城区| 新竹县| 常德市| 武清区| 吉隆县| 黄大仙区| 涟源市| 潼关县| 临江市| 阳山县| 伊通| 延吉市| 十堰市| 香港| 胶州市| 治多县| 广宗县| 临夏市| 天祝| 华池县| 菏泽市| 徐闻县| 琼海市| 镇坪县| 贡觉县| 兴义市| 齐齐哈尔市| 台前县| 巩义市| 文化| 视频| 黄平县| 黎川县|