- 計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)(第3版)
- 張兆豐主編
- 2133字
- 2024-05-23 16:57:33
1.5 預(yù)備知識(shí):統(tǒng)計(jì)學(xué)基礎(chǔ)
1.5.1 隨機(jī)現(xiàn)象、隨機(jī)試驗(yàn)與概率
隨機(jī)現(xiàn)象是無(wú)法事先準(zhǔn)確確定其結(jié)果的現(xiàn)象。在社會(huì)經(jīng)濟(jì)領(lǐng)域中,隨機(jī)現(xiàn)象是普遍存在的,研究隨機(jī)現(xiàn)象,對(duì)認(rèn)識(shí)這些現(xiàn)象是非常必要的。
觀察隨機(jī)現(xiàn)象或?yàn)榱擞^察隨機(jī)現(xiàn)象而進(jìn)行的試驗(yàn)稱為隨機(jī)試驗(yàn)。隨機(jī)現(xiàn)象可以重復(fù)多次;可能的結(jié)果不止一個(gè),但事先可知;每次試驗(yàn)都會(huì)出現(xiàn)上述結(jié)果中的某一個(gè),但事先不能預(yù)知是哪一個(gè)。
隨機(jī)試驗(yàn)的每個(gè)可能結(jié)果稱為一個(gè)樣本點(diǎn),全體樣本點(diǎn)的集合稱為樣本空間。隨機(jī)試驗(yàn)的結(jié)果稱為隨機(jī)事件,隨機(jī)事件由一系列樣本點(diǎn)組成。
某隨機(jī)事件A發(fā)生的可能性稱為事件A發(fā)生的概率,記為p(A),(0≤p(A)≤1)。p(A)=0表示不可能發(fā)生的事件,p(A)=1表示必然發(fā)生的事件。
1.5.2 隨機(jī)變量
以隨機(jī)試驗(yàn)的結(jié)果為取值的變量稱為隨機(jī)變量。一個(gè)隨機(jī)變量具有下列性質(zhì):可以取許多不同的數(shù)值,取這些數(shù)值的概率為p。
重復(fù)抽樣得到的樣本就是一個(gè)隨機(jī)變量,所謂“樣本容量為n的樣本”就是n個(gè)相互獨(dú)立且與總體有相同分布的隨機(jī)變量X1,…,Xn。每次具體抽樣所得的數(shù)據(jù),就是n元隨機(jī)變量的一個(gè)觀察值,記為(X1,…,Xn)。
隨機(jī)變量可以分為離散隨機(jī)變量和連續(xù)隨機(jī)變量。一個(gè)離散隨機(jī)變量只能取有限(或可數(shù)無(wú)窮)多個(gè)值,例如,投擲骰子的所有可能點(diǎn)數(shù)為1~6中的任何一個(gè),我們就可以定義隨機(jī)變量為點(diǎn)數(shù)X=1,2,3,4,5,6,因此它是一個(gè)離散隨機(jī)變量。連續(xù)隨機(jī)變量可以取某一區(qū)間的任何值,如人的身高、體重、學(xué)生的分?jǐn)?shù)等都是連續(xù)隨機(jī)變量。
若X為一隨機(jī)變量,對(duì)任意實(shí)數(shù)x,稱F(x)=p(X<x)為隨機(jī)變量X的分布函數(shù)。對(duì)于連續(xù)隨機(jī)變量:

其中f(x)≥0。
我們稱f(x)為X的概率分布密度函數(shù),簡(jiǎn)稱為分布密度。
分布密度函數(shù)具有如下性質(zhì):
(1)f(x)≥0;
(2)=1;
(3);
(4)F′(x)=f(x)。
如果X的分布密度為f(x),則記為X~f(x)。
1.5.3 隨機(jī)變量的數(shù)字特征
1.數(shù)學(xué)期望
數(shù)學(xué)期望也稱為均值,它描述隨機(jī)變量(總體)的一般水平,從計(jì)算方法上看它是一個(gè)加權(quán)平均值。
離散隨機(jī)變量X的數(shù)學(xué)期望記為E(X)或μ,定義如下:

式中 p(x)——取x值的概率。
連續(xù)隨機(jī)變量數(shù)學(xué)期望的定義如下:

式中 f(x)——分布密度。
數(shù)學(xué)期望具有如下性質(zhì)。
(1)如果a,b為常數(shù),則E(aX+b)=aE(X)+b,特別的是E(b)=b。
(2)如果X,Y為兩個(gè)隨機(jī)變量,則E(X+Y)=E(X)+E(Y)。
(3)如果g(x)和f(x)分別為X的兩個(gè)函數(shù),則E[g(X)+f(X)]=E[g(X)]+E[f(X)]。
(4)如果X,Y是兩個(gè)獨(dú)立的隨機(jī)變量,則E(XY)=E(X)E(Y)。
2.方差
如果隨機(jī)變量X的數(shù)學(xué)期望E(X)存在,稱[X-E(X)]為隨機(jī)變量X的離均差或離差,顯然,隨機(jī)變量離均差的數(shù)學(xué)期望是0,即E[X-E(X)]=0。
隨機(jī)變量離差平方的數(shù)學(xué)期望叫作隨機(jī)變量的方差,記作Var(X)或σ2,即:

方差的算術(shù)平方根稱為標(biāo)準(zhǔn)差,即:

方差和標(biāo)準(zhǔn)差刻畫(huà)了隨機(jī)變量取值相對(duì)于均值的分散程度,方差或標(biāo)準(zhǔn)差的值越大,說(shuō)明隨機(jī)變量的取值越分散。
方差具有以下性質(zhì)(c是常數(shù)):
(1)Var(c)=0;
(2)Var(c+X)=Var(X);
(3)Var(cX)=c2Var(X);
(4)X,Y為相互獨(dú)立的隨機(jī)變量,則
Var(X+Y)=Var(X)+Var(Y)=Var(X-Y)
(5)Var(X)=E(X2)-(E(X))2。
3.協(xié)方差
設(shè)X,Y是兩個(gè)隨機(jī)變量,定義X,Y的協(xié)方差為

如果X=Y,則有Cov(X,Y)=E[X-E(X)]2=Var(X)=σ2。
4.相關(guān)系數(shù)
描述X與Y線性相關(guān)程度可以用相關(guān)系數(shù)度量,X與Y的相關(guān)定義為

相關(guān)系數(shù)的取值范圍為[-1,1],ρ>0說(shuō)明X與Y為正相關(guān),反之為負(fù)相關(guān);越接近1,說(shuō)明X與Y的相關(guān)程度越高,反之越低。
1.5.4 重要的理論分布
1.正態(tài)分布
分布密度為

正態(tài)分布如圖1-1所示。

圖1-1 正態(tài)分布
正態(tài)分布取決于兩個(gè)參數(shù):均值μ和方差σ2。如果X服從正態(tài)分布,則記為X~N(μ,σ2)。
如果正態(tài)分布μ=0,σ2=1,則稱其為標(biāo)準(zhǔn)正態(tài)分布,記為Z~N(0,1)。標(biāo)準(zhǔn)正態(tài)分布的分布密度為

標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)記為Φ(Z),即,它有三個(gè)重要的性質(zhì):
(1)p(a<Z<b)=Φ(b)-Φ(a);
(2)Φ(-a)=1-Φ(a);
(3)。
利用這三個(gè)性質(zhì),可以查標(biāo)準(zhǔn)正態(tài)分布表得到相應(yīng)的概率。
可以證明,對(duì)于任意一個(gè)正態(tài)分布,我們都可以通過(guò)標(biāo)準(zhǔn)化變換為標(biāo)準(zhǔn)正態(tài)分布:

這樣,我們可以求出任意一個(gè)正態(tài)分布所對(duì)應(yīng)的概率。
關(guān)于正態(tài)分布還有一個(gè)重要的結(jié)論:如果X1,X2,…,Xn都是服從的獨(dú)立隨機(jī)變量,那么其線性組合
也服從均值為
、方差為
的正態(tài)分布,即:

2.χ2分布
設(shè)Z1,Z2,…,Zk是互相獨(dú)立的標(biāo)準(zhǔn)化的正態(tài)分布變量,則服從自由度為k的χ2分布,記為Z~χ2(k)。
χ2分布取決于自由度k。χ2分布的分布密度圖像是一個(gè)右偏分布(見(jiàn)圖1-2),當(dāng)k的值越來(lái)越大時(shí),χ2分布的分布密度圖像會(huì)越來(lái)越趨于對(duì)稱。一般認(rèn)為,當(dāng)自由度超過(guò)100時(shí),χ2分布近似為正態(tài)分布。

圖1-2 χ2分布圖
查χ2分布表可以得到給定自由度及上側(cè)面積的臨界值。
3.t分布
如果Z1~N(0,1),Z2~χ2(k),則服從t分布,記為t~t(k)。
t分布取決于自由度,形態(tài)是對(duì)稱分布,與標(biāo)準(zhǔn)正態(tài)分布近似,但比較平緩(見(jiàn)圖1-3),當(dāng)自由度越來(lái)越大時(shí),趨近于標(biāo)準(zhǔn)正態(tài)分布。

圖1-3 t分布與標(biāo)準(zhǔn)正態(tài)分布
查t分布表可以得到給定自由度及上側(cè)面積的臨界值。
4.F分布
如果Z1~χ2(k1),Z2~χ2(k2),則服從自由度為k1,k2的F分布,記為F~F(k1,k2),其中k1稱為分子自由度,k2稱為分母自由度。
F分布取決于自由度,是右偏分布(見(jiàn)圖1-4)。

圖1-4 F分布
查F分布表可以得到給定自由度及上側(cè)面積的臨界值。
1.5.5 統(tǒng)計(jì)推斷
1.參數(shù)估計(jì)
參數(shù)估計(jì)是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的統(tǒng)計(jì)方法。參數(shù)估計(jì)分為點(diǎn)估計(jì)和區(qū)間估計(jì)兩種,進(jìn)行參數(shù)估計(jì)需要知道統(tǒng)計(jì)量的分布——抽樣分布。
在參數(shù)估計(jì)中用得最多的是用樣本平均數(shù)估計(jì)總體均值,關(guān)于樣本平均數(shù)的抽樣分布的結(jié)論是中心極限定理。
設(shè)總體均值為μ,且存在有限方差σ2,從中抽取樣本容量為n的樣本。當(dāng)樣本容量足夠大時(shí),樣本平均數(shù)的抽樣分布近似地服從正態(tài)分布。這個(gè)結(jié)論用數(shù)學(xué)表達(dá)式表示為

根據(jù)中心極限定理,可以認(rèn)為樣本平均數(shù)圍繞在總體均值μ附近,故對(duì)于某一個(gè)樣本平均數(shù)
,可以認(rèn)為
,即
是μ的一個(gè)點(diǎn)估計(jì)值。
在點(diǎn)估計(jì)的基礎(chǔ)上,給出μ的一個(gè)取值范圍,稱為區(qū)間估計(jì)。
當(dāng)總體方差已知,大樣本,顯著性水平為α時(shí),μ的1-α的置信區(qū)間是:

其中Z~N(0,1)。
當(dāng)總體方差未知,大樣本,顯著性水平為α時(shí),μ的1-α的置信區(qū)間是:

如果是小樣本,則要求總體服從正態(tài)分布,仍然可以用式(1-16)和式(1-17)進(jìn)行估計(jì)。
此外,我們可以得到常用的統(tǒng)計(jì)量樣本比率、樣本方差的抽樣分布,并運(yùn)用這些分布對(duì)對(duì)應(yīng)的總體比率和總體方差進(jìn)行估計(jì)。
2.假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)也稱為顯著性檢驗(yàn),是用來(lái)判斷樣本與樣本、樣本與總體的差異是由抽樣誤差還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。其基本原理是先對(duì)總體的特征做出某種假設(shè),然后通過(guò)抽樣研究的統(tǒng)計(jì)推理,對(duì)此假設(shè)應(yīng)該被拒絕還是接受做出推斷。
假設(shè)檢驗(yàn)的邏輯方法是反證法和小概率原理,并運(yùn)用樣本統(tǒng)計(jì)量的分布來(lái)進(jìn)行判斷。其基本步驟為:提出假設(shè)→建立檢驗(yàn)統(tǒng)計(jì)量并確定其分布→設(shè)定顯著性水平并構(gòu)造拒絕域→根據(jù)檢驗(yàn)統(tǒng)計(jì)量的值做決策。
假設(shè)檢驗(yàn)的決策規(guī)則是:如果檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域,則拒絕原假設(shè),否則不拒絕。
上述決策的方法稱為臨界值法,我們還可以根據(jù)檢驗(yàn)統(tǒng)計(jì)量的伴隨概率——p值進(jìn)行檢驗(yàn)。決策的規(guī)則是:如果p值小于顯著性水平,則拒絕原假設(shè),否則不拒絕。
限于篇幅,對(duì)于統(tǒng)計(jì)學(xué)的具體內(nèi)容,讀者可參閱其他專門(mén)的統(tǒng)計(jì)學(xué)資料。
- 國(guó)際貿(mào)易學(xué)
- 市場(chǎng)營(yíng)銷學(xué)(第二版)
- 管理信息系統(tǒng)項(xiàng)目式案例教程
- 食品生物技術(shù)
- 2020年貨幣銀行學(xué)考研真題(含復(fù)試)與典型題詳解[附贈(zèng)兩套模擬試題]
- 《新版中日交流標(biāo)準(zhǔn)日本語(yǔ)高級(jí)(上)》學(xué)習(xí)指南【課文重點(diǎn)+詞匯剖析+語(yǔ)法精解+拓展知識(shí)+全文翻譯】
- 電力電子裝置及系統(tǒng)
- 重慶大學(xué)《建筑構(gòu)造(下冊(cè))》(第5版)筆記和典型題詳解
- 多維新媒體營(yíng)銷
- 文學(xué)理論
- 世界通史(第三版)·第一編·古代文明與地域性歷史:1500年以前的世界
- 大學(xué)語(yǔ)文翻轉(zhuǎn)課堂的應(yīng)用能力訓(xùn)練
- 多恩布什《宏觀經(jīng)濟(jì)學(xué)》(第10版)課后習(xí)題詳解
- 2020年云南省公安招警考試《公安專業(yè)科目》題庫(kù)【真題精選+章節(jié)題庫(kù)+模擬試題】
- 當(dāng)代西方文藝?yán)碚摚ǖ谌妫?/a>