官术网_书友最值得收藏!

§2 方差

一、方差的定義

有兩批鋼筋,每批各10根,它們的抗拉強度指標如下:

第一批 115,120,120,120,120,125,130,130,135,135;

第二批 90,100,105,120,125,135,135,135,145,160。

它們的平均抗拉強度都是125。但是,質量要求抗拉強度指標不低于115。那么,第二批鋼筋的抗拉強度指標較差:其一取值較分散,抗拉強度指標有的較大,有的較小,與其均值偏差較大;其二,不合格的根數較多,實用價值差。

可見,只靠期望值(平均值)還不足以說明隨機變量的分布特征,還必須研究隨機變量取值與其平均值的偏離程度。

定義2.1 設X是一個隨機變量,若EX-EX)]2存在,則稱EX-EX)]2X方差(variance,dispersion),記為var(X)(或σ2X)),即

var(X)=EX-EX)]2 ?。?.1)

在應用上還需要引入與隨機變量X具有相同量綱的量(或σX)),稱其為標準差。

關于隨機變量的數學期望(平均值)有一重要結果:設k為任一實數,隨機變量X關于k的平方誤差的均值EX-k2可視為k的函數,記作fk),即fk)=EX-k2,可以證明,當k=EX時,fk)達到最小值fEX)=EX-EX2,這個最小值恰好是X的方差,證明過程由讀者自行完成。

這個極值等式的概率意義是,若欲用一個實數集中代表一個隨機變量,則隨機變量的數學期望是最理想的。這再一次說明了數學期望表示了隨機變量取值的集中位置,而方差,則表示了隨機變量的取值相對于它的數學期望的集中程度。具體而言,若隨機變量的取值比較集中在其數學期望附近,則它的方差較?。环粗?,若取值相對于數學期望比較分散,則方差較大。

二、方差的計算公式

由定義知,方差實際上就是隨機變量X的函數gX)=[X-EX)]2的數學期望,于是對于離散型隨機變量X,設其分布律為

P{X=xk}=pk?。?span id="zfpu1lh" class="italic">k=1,2,3,…)

則       (2.2)

對于連續型隨機變量X,設其分布密度為fx),則

   (2.3)   

計算方差,往往使用下面公式

var(X)=EX2)-[EX)]2 ?。?.4)

證明 由方差的定義及數學期望的性質有

下面推導幾種重要的隨機變量的方差。

【例1】 設XPλ),求var(X)。

 k=0,1,2,…;λ>0)

我們已知EX)=λ,下面計算EX2

由此可知,對于服從泊松分布的隨機變量的期望與方差都等于參數λ,因為泊松分布只含有一個參數λ,因此只要知道它的數學期望或方差就能完全確定它的分布了。

【例2】 設X在(a,b)上服從均勻分布,求var(X)。

 因為X的分布密度為

我們已知,利用方差的計算公式,則有

【例3】 設XNμ,σ2),求var(X)。

 X的概率密度為

,得

由本章§1例4知,若XNμ,σ2),則EX)=μ,現又推得var(X)=σ2,這說明正態分布的隨機變量完全由它的數學期望和方差所確定。

設隨機變量X存在數學期望EX)與方差var(X),則隨機變量

   (2.5)   

稱為隨機變量X的標準化,顯然它滿足

EX*)=0,var(X*)=1

例如,若XNμ,σ2),則(0,1)。

在實際應用中,一般隨機變量都具有度量的單位,為了擺脫度量單位對處理過程及其結果的影響,可以通過式(2.5)標準化,得到無量綱的標準化隨機變量X*。

為了使方差能夠更準確地描述隨機變量的取值相對于它的數學期望(均值)的分散程度(集中程度的對立面),應該考慮單位均值上的標準差,即,它與隨機變量X的單位無關。

定義2.2 設X是一個隨機變量,若EX)和var(X)存在,則稱X的變異系數(coefficient of variation),記作CVX),即

   (2.6)   

三、方差的性質

下面介紹方差的幾個重要性質(以下假設隨機變量方差存在)。

(1)設C是常數,則var(C)=0。

(2)設X是隨機變量,C是常數,則有var(CX)=C2var(X)。

(3)設XY是兩個相互獨立的隨機變量,則

var(X+Y)=var(X)+var(Y

(4)var(X)=0的充分必要條件是X以概率1取常數C,即

P{X=C}=1

顯然,這里C=EX)。證略。

下面只證明(3)。

由于X,Y相互獨立,X-EX)與Y-EY)也相互獨立,由數學期望的性質知

所以  var(X+Y)=var(X)+var(Y

這一性質可以推廣到有限個相互獨立的隨機變量的情況。

需要指出的是,相互獨立的隨機變量之和的方差,等于各隨機變量方差之和這一結論,是方差的一條極為重要的性質,稱為方差的可加性。與均值的可加性(隨機變量之和的均值,等于各隨機變量均值之和)相比較,方差的可加性要求各隨機變量相互獨立,而均值的可加性不需要任何獨立性條件。

【例4】 設XBn,p),求var(X

 設Xi的分布律為

X1,X2,…,Xn相互獨立。由第二章§4例5知,二項分布可看成n個相互獨立的且服從同一(0—1)分布的隨機變量之和,即,則

主站蜘蛛池模板: 鄂州市| 淄博市| 阿拉尔市| 阿巴嘎旗| 吐鲁番市| 陆良县| 布拖县| 尤溪县| 洛浦县| 江阴市| 雷州市| 寿宁县| 镇坪县| 福清市| 姚安县| 芜湖市| 彭山县| 故城县| 南通市| 桂东县| 南溪县| 黄陵县| 哈密市| 肇源县| 岳西县| 凤山县| 旬阳县| 湄潭县| 河源市| 安义县| 平阴县| 井研县| 麻栗坡县| 鄂托克前旗| 普安县| 博兴县| 德化县| 江阴市| 新河县| 鹤庆县| 黄骅市|