官术网_书友最值得收藏!

第一節 統計量和抽樣分布

統計推斷的目的是基于從總體中選取的樣本來對總體下結論。通常我們會對用于分析的隨機樣本進行假設。我們定義一組容量為n的樣本,這些是獨立同分布的。這些樣本來自于無限總體或有限總體,采用的是等概率的抽樣方式。

盡管我們將研究的大多數方法是在假設隨機樣本已經被使用的前提下,但是在質量控制中還是會存在其他的抽樣方法。我們需要在使用統計方法進行分析時,確認這種方法要適合任何的樣本設計方案;否則,當我們使用其他抽樣技術搜集數據時,統計推斷的結論可能會導致嚴重的錯誤。

統計推斷主要利用從樣本數據中計算得到的量。統計量指由樣本數據計算出的任何的量。例如,令表示樣本,則樣本均數為

  (3-1)

樣本方差為

  (3-2)

樣本標準差為

  (3-3)

這些都是統計量。樣本均數和樣本方差描述了樣本數據的集中趨勢和變異。

如果已知樣本來自的總體的概率分布,可以由樣本統計量來決定概率分布的形式。統計量的概率分布稱為抽樣分布。現在將討論抽樣分布與三個一般抽樣情況之間的聯系。

一、從正態分布總體中抽樣

假設x是服從均數為μ、方差為σ2的正態分布。如果從中抽取容量為n的樣本,記為,則樣本均值服從正態分布

這個結論不僅對于正態總體是如此,對于其他的總體分布,也有同樣的結論。這是因為由下面的式子:

  (3-4)

根據中心極限定理我們知道,無論總體的分布如何,的分布都近似服從均數為,方差為的正態分布。因此,無論總體的分布如何,樣本均數的抽樣分布都近似服從正態分布,即

除正態分布以外另一個重要的抽樣分布是分布,如果是來自于標準正態,則隨機變量

  (3-5)

服從自由度為n分布。自由度為n分布為

  (3-6)

圖3-1 不同自由度的分布

不同自由度的分布如圖3-1所示。分布是偏態的,均數,方差。為了分析如何使用分布,假設來自于正態分布。則隨機變量

  (3-7)

服從自由度為分布。由樣本方差的計算公式,上式可以寫成:

因此當樣本來自于正態分布時,服從自由度為分布。

另一個常用的分布是分布。如果是服從標準正態分布的隨機變量,是服從自由度為的隨機變量,如果是獨立的,則隨機變量

  (3-8)

服從自由度為分布。的概率分布為:

  (3-9)

t分布的均值為μ=0,方差為t分布的分布圖如圖3-2所示。需要注意的是,如果,此時的t分布無限接近標準正態分布。

圖3-2 不同自由度的t分布

假設來自于正態分布。如果s2可由樣本計算得到,并且由,可得

由于s2是獨立的,所有隨機變量

  (3-10)

服從自由度為n-1的t分布。

基于正態分布基礎上隨后一個抽樣分布是F分布。如果是兩個獨立的、分別服從以為自由度的分布,則比值

  (3-11)

服從分子自由度為u、分母自由度為vF分布。F分布的概率密度函數為:

  (3-12)

F分布的分布圖如圖3-3所示。

圖3-3 不同uvF分布圖

舉一個服從F分布的隨機變量的例子。假設有兩個變量服從獨立的正態分布過程,其中。令是來自于第一個正態過程的樣本,樣本容量為是來自于第二個正態過程的樣本,樣本容量為n2,如果是兩個樣本的樣本方差,則

  (3-13)

F分布主要用于推斷兩正態分布的總體方差是否存在差異。

主站蜘蛛池模板: 哈巴河县| 固原市| 科技| 鞍山市| 韩城市| 天全县| 白玉县| 普宁市| 金溪县| 安远县| 南丰县| 资兴市| 临颍县| 濮阳县| 泗洪县| 江华| 连州市| 辉县市| 龙岩市| 科技| 理塘县| 奈曼旗| 中牟县| 温宿县| 阜宁县| 湘潭县| 门头沟区| 社旗县| 凤山市| 万荣县| 玉环县| 绿春县| 策勒县| 桃园市| 阿勒泰市| 呼伦贝尔市| 云梦县| 兴义市| 遵化市| 南京市| 双江|